信息的保鲜期-流动知识的检索

Jun 18, 2024 · 1688 words · 4 min ·   #Input #Ramble

AI摘要

正在生成中……



信息摄入的重要性不再多聊,§信息输入 | Vandee’s Digital Garden 里整理了一些。今天想到了一个新概念:知识的保鲜期。

知识的保鲜期#

🙏少读点书,多刷刷抖音吧 – 虹线,这篇文章里提出了一个很有意思的观点:

其实在很早以前,我就已经有这种感觉了。因为,在一个快速流变的世界里,知识本身理应是速朽的。能够在一定程度上抵御时间雨的作品,要么非常宏观(比如哲学与物理),要么非常微观(比如积极心理学和烹饪),而夹在此二者之间的部分,都在以月为单位更新。

而恰恰,现代世界的主体就寄宿在中观层面——我们的吃喝玩乐、衣食住行、生老病死,我们所遇到的大部分人、事、物,左右我们情感的经历、境遇、情景,都源自中观世界。

而在一个动态的中观世界里遇到的事情,去书籍的静态世界里寻找解释,多少是有点缘木求鱼。

一个逆向的利用信息茧房来完善认知的思路。标题感觉多少有些故意而为之,思路可以借鉴。

现在的知识,特别是有关AI的知识,更新的很快,因为AI本身的迭代速度太快了。

借用作者的“中观层面”概念,现在暂且把知识、信息分为:固定知识(常青知识),流动知识。

固定知识对应我现有的PKM「base库」也就是Vandee’s Digital Garden,流动知识对应「流动知识库」。这些知识,随着时间的锤炼就会转化为技能、能力,最后体现为价值。

而流动的知识,就有「知识的保鲜期」。就拿prompt和RAG来说,可能这个月还挺好用的,下个月就不灵了。对于这部分信息,当然需要区别处理。

流动信息检索#

在面对这些本来就更新很快的知识、信息,获取的渠道就远比信息本身重要了。

这些流动的知识,以往就大量存在于互联网之上,以后更会存在于各大LLM的护城河当中,当然我也在构建自己的知识LLM助手。对于这部分知识,就应当保持它的新鲜。需要使用的时候,查询即可。不需要长期记忆。

就我目前看到的几个做成的AI新闻网页:BriefNews Minimalist 指南 | Informed AI News,它们的初衷也和上面说的类似。

在未来一定更需要的能力:检索、整合、利用信息的能力。现在想做的一个事:把我的RSS订阅源按照领域分类,然后接入LLM,在需要检索特定领域的信息时,这就是我的另一个流动知识库。既然现在各大搜索阵营打的一塌糊涂,干脆就自己想办法吧。

未来整合信息的工具就是更易用的LLM,而优化LLM检索的工具就是prompt。刘海:Prompt 纵向研究的最新成果:伪代码提示词 - 飞书云文档,prompt不是一个专业性很强的技能,发展的也很快,也越来越易用,掌握起来难度并不高,prompt相关的必备知识和信息检索也是正相关的。

很庆幸在前几年误打误撞的学了一段时间Python,现在在prompt和LLM里也用得上。

我现在预想的这个「流动知识库」的构成也挺简单:RSS订阅源、信息源+LLM+prompt+输出md文档。最后只需要用ollama接入LLM提问就好了。这个东西之前一直断断续续的在弄,因为现在做出来的太不智能,就不分享出来献丑了🤣,不是分类不准,就是格式不对。

例如我想思考:艺术里关于美的观点,只需要在「流动知识库」里搜索,就可以知道我关注的领域内,最新的观点。

除了这些,一直想作这个检索还有一个原因就是:我讨厌被别人选择。

很早就在想,由于 AI 的接入,搜索引擎,SEO 会怎么发展,比较确定的是,以各个 AI 模型为基础的阵营还是会相互独立,划定城池,合纵连横,百度有百度的城,字节有自己的城,OpenAI 有自己的城,烽火连天。以往是以互联网内容为基础的搜索结果,现在中间加入了 AI 生成,过滤了一次原网页,有点套娃其实,当然由于互联网和人类知识的预料已经支撑不了 AI 的训练了,以后 AI 会根据自己生成的语料反复训练自己,这其实挺可怕的,以后我们搜索到的内容居然不是人类的了。

对我来说,最大的影响是信息的摄入以及新闻的相对真实性。OpenAI 早就开始布局新闻这部分了,还有教育等各个领域,野心确实很大,可以感觉的到,他们是一定会涉足有关人类信息的各个领域。掌控了话语权,掌控了开口说话的嘴,掌控了人类的认知途径与习惯,以及下一代的教育,就掌控了这个信息世界。

为什么应该 (从现在开始就) 热爱你的热爱 | Vandee’s Blog



See also