开源论文神器来了,结果直接登顶GitHub热榜,狂揽8000+星!
只需跟DocsGPT聊聊天,就可以查找各种文档中的信息。
目前支持的文档类型包括TXT、PDF 、ZIP、MD、RST。
它是靠大模型(比如GPT-3.5)、meta相似性搜索库Faiss以及LangChain来驱动。
现在,不光网页端可以使用,还支持本地化部署、Chrome插件。
事实上早在几个月前,DocsGPT刚释出测试版时,就受到了不少关注。
效果如何?
以网页端为例,只需要三步就可以体验到:
1、注册;2、上传;3、询问。
一上来就是默认GPT-3.5模式,除此之外,还有四种模式可供选择。但你要想使用GPT-4,就需要购买Pro,每月10刀。
其中DocsGPT-7b是他们专门针对DocsGPT优化的开源模型,基础模型包括Falcon、LIama2。
话不多说,来试试实际体验(默认GPT-3.5)效果。
首先上传文档,需要稍等它几分钟「训练」。
要是不上传,也可以直接提供论文内容,比如摘要也是OK的。
以斯坦福关于GPT-4作同行评审的研究为例。
但要是直接甩个论文链接,它是不支持的。
上传之后,就可以随便问问题了。我们以同样支持文档上传的Claude为对比。
第一回合:简单概括一下这篇论文。
可以看到,两位选手在事实性上基本上没有问题。而Claude采用了总分总回答结构,还介绍了评估方法、结果等内容。嗯,很全面。
而DocsGPT则是更偏重于结果分析,但同样也提到了两种评估方式。
第二回合:询问方法细节——论文研究了多少篇Nature文章。
Claude回答得更全面,且更针对问题本身;而DocsGPT则延展出了收集的评论、时间范围。
最后还不忘说一句:
第三回合:论文作者和研究机构
这一把DocsGPT败下阵来了,并没有得出该论文的作者和所属研究机构。
如何食用?
除了网页版直接测试之外, DocsGPT还给出了提示指南、本地部署以及Chrome插件安装指南。
要是想避免DocsGPT出现幻觉,官方建议这种话术。
可以说是很贴心了。
这套工具开发来自一家数据管理公司ARC53,DocsGPT正是他们在大模型时代下的最新开发工具。
两位联合创始人Alex Tushynski和Pavel Torbin均毕业于爱丁堡大学。
感兴趣的朋友,可直接戳下方链接进行体验。
参考链接:
[1]https://docsgpt.arc53.com/
[2]https://github.com/arc53/DocsGPT
—完—