Press "Enter" to skip to content

作者: admin

大模型“涌现”的思维链,究竟是一种什么能力?

天灵灵地灵灵,大模型快“显灵” 听说最近AI大厂的开发人员和高校的NLP研究人员,都在琢磨,怎么让大模型“涌现”。那画面莫名就让我想到了程序员给服务器上香来保佑不宕机,都有种求诸于天的玄学。 所谓“涌现”,在大模型领域指的是当模型突破某个规模时,性能显著提升,表现出让人惊艳、意想不到的能力。比如语言理解能力、生成能力、逻辑推理能力等。一般来说,模型在100亿到1000亿参数区间,可能产生能力涌现。…

Leave a Comment

本地接口调用OpenAI接口,初探OpenAI的Function calling

由我们对话式的生成式人工智能到我们所谓的AI Agent演进,函数式调用是当前可以看到最有机会的方式。 用户可以用日常语言来让AI决策到底使用哪个接口来完成用户的任务,也可以通过用户的对话抽离出接口参数。 可以参考: https://platform.openai.com/docs/guides/function-calling https://cookbook.openai.com/exampl…

Leave a Comment

MySQL 报错 incorrect datetime value ‘0000-00-00 00:00:00‘ for column

MySQL报incorrect datetime value ‘0000-00-00 00:00:00’ for column错误原因,是由于在MySQL5.7版本以上,默认设置SQL_Mode模式,在模式里有NO_ZERO_DATE,NO_ZERO_IN_DATE,存在表示系统里DATE类型字段不能有0值,所以在执行update 操作时汇报此错误。那么如何解决有以下几个思…

Leave a Comment

文本生成系列之因果语言模型

1. 简介 在前面一章我们已经介绍过文本生成任务中非常流行的一种模型结构,encoder-decoder,但是除此之外,还存在其他一些不一样的模型结构。本文主要介绍另外一种模型结构,因果语言模型。因果语言模型(causal language model),是跟掩码语言模型相对的语言模型,跟transformer机制中的decoder很相似,因果语言模型采用了对角掩蔽矩阵,使得每个token只能看到…

Leave a Comment

code-server 配合jupyter一直卡在加载中

最近尝试搭建code-server 然后安装了python和jupyter的依赖,发现一直卡在加载中 上面有个加载条一直在转,无法显示。 后面误打误撞发现,直接用ip端口的方式访问code-server会这样, 如果配置nginx加上ssl证书,就好了,应该就是ssl证书的问题。

Leave a Comment