天灵灵地灵灵,大模型快“显灵” 听说最近AI大厂的开发人员和高校的NLP研究人员,都在琢磨,怎么让大模型“涌现”。那画面莫名就让我想到了程序员给服务器上香来保佑不宕机,都有种求诸于天的玄学。 所谓“涌现”,在大模型领域指的是当模型突破某个规模时,性能显著提升,表现出让人惊艳、意想不到的能力。比如语言理解能力、生成能力、逻辑推理能力等。一般来说,模型在100亿到1000亿参数区间,可能产生能力涌现。…
Leave a Comment作者: admin
由我们对话式的生成式人工智能到我们所谓的AI Agent演进,函数式调用是当前可以看到最有机会的方式。 用户可以用日常语言来让AI决策到底使用哪个接口来完成用户的任务,也可以通过用户的对话抽离出接口参数。 可以参考: https://platform.openai.com/docs/guides/function-calling https://cookbook.openai.com/exampl…
Leave a CommentMySQL报incorrect datetime value ‘0000-00-00 00:00:00’ for column错误原因,是由于在MySQL5.7版本以上,默认设置SQL_Mode模式,在模式里有NO_ZERO_DATE,NO_ZERO_IN_DATE,存在表示系统里DATE类型字段不能有0值,所以在执行update 操作时汇报此错误。那么如何解决有以下几个思…
Leave a Comment安装好这些依赖,然后去 https://huggingface.co/models?pipeline_tag=text-generation&sort=trending 找到你看上的模型,按照模型介绍页面搞个模型的运行脚本,基本上就能跑起来了。
Leave a Comment1. 简介 在前面一章我们已经介绍过文本生成任务中非常流行的一种模型结构,encoder-decoder,但是除此之外,还存在其他一些不一样的模型结构。本文主要介绍另外一种模型结构,因果语言模型。因果语言模型(causal language model),是跟掩码语言模型相对的语言模型,跟transformer机制中的decoder很相似,因果语言模型采用了对角掩蔽矩阵,使得每个token只能看到…
Leave a Comment安装git-lfs 需要git版本高于1.8.3 Debian / Ubuntu MacOS (Using Homebrew) 克隆项目 在huggingface搜索你想要下载的模型,然后点击Files and versions: 然后右边3个点,点开有个Clone repository: 点开就有克隆命令了。 然后指向项目克隆: 然后模型文件就开始正常拉取了。 参考资料: https://blo…
Leave a Comment深度学习基础篇 深度学习进阶篇 深度学习应用篇 产业实践篇 强化学习篇 面试宝典 Next 参考资料: https://paddlepedia.readthedocs.io/en/latest/index.html
Leave a Comment解决方法: 首先确保你已经安装了Python的插件。 点击左下角齿轮设置 -> 搜索 “python.languageServer” ,出来 python.languageServer的设置项目,他现在可能是 Default,帮他改成 Jedi, 重新加载页面。 参考资料: https://zhuanlan.zhihu.com/p/344118024
Leave a Comment最近尝试搭建code-server 然后安装了python和jupyter的依赖,发现一直卡在加载中 上面有个加载条一直在转,无法显示。 后面误打误撞发现,直接用ip端口的方式访问code-server会这样, 如果配置nginx加上ssl证书,就好了,应该就是ssl证书的问题。
Leave a Comment