AIGC – 第 3 页 – 小菜菜的博客

大模型“涌现”的思维链，究竟是一种什么能力？

Published 2024年3月26日 by admin

天灵灵地灵灵，大模型快“显灵” 听说最近AI大厂的开发人员和高校的NLP研究人员，都在琢磨，怎么让大模型“涌现”。那画面莫名就让我想到了程序员给服务器上香来保佑不宕机，都有种求诸于天的玄学。所谓“涌现”,在大模型领域指的是当模型突破某个规模时，性能显著提升，表现出让人惊艳、意想不到的能力。比如语言理解能力、生成能力、逻辑推理能力等。一般来说，模型在100亿到1000亿参数区间，可能产生能力涌现。…

Leave a Comment

本地运行大语言模型必要的几个包

Published 2024年3月17日 by admin

安装好这些依赖，然后去 https://huggingface.co/models?pipeline_tag=text-generation&sort=trending 找到你看上的模型，按照模型介绍页面搞个模型的运行脚本，基本上就能跑起来了。

Leave a Comment

文本生成系列之因果语言模型

Published 2024年3月16日 by admin

1. 简介在前面一章我们已经介绍过文本生成任务中非常流行的一种模型结构，encoder-decoder，但是除此之外，还存在其他一些不一样的模型结构。本文主要介绍另外一种模型结构，因果语言模型。因果语言模型（causal language model），是跟掩码语言模型相对的语言模型，跟transformer机制中的decoder很相似，因果语言模型采用了对角掩蔽矩阵，使得每个token只能看到…

Leave a Comment

huggingface下载大模型文件

Published 2024年3月14日 by admin

安装git-lfs 需要git版本高于1.8.3 Debian / Ubuntu MacOS (Using Homebrew) 克隆项目在huggingface搜索你想要下载的模型，然后点击Files and versions：然后右边3个点，点开有个Clone repository：点开就有克隆命令了。然后指向项目克隆：然后模型文件就开始正常拉取了。参考资料： https://blo…

Leave a Comment

深度学习百科及面试资源

Published 2024年3月13日 by admin

深度学习基础篇深度学习进阶篇深度学习应用篇产业实践篇强化学习篇面试宝典 Next 参考资料： https://paddlepedia.readthedocs.io/en/latest/index.html

Leave a Comment

分类： AIGC

大模型“涌现”的思维链，究竟是一种什么能力？

本地运行大语言模型必要的几个包

文本生成系列之因果语言模型

huggingface下载大模型文件

深度学习百科及面试资源