新一代注意力机制Lightning Attention-2:无限序列长度、恒定算力开销、更高建模精度

新一代注意力机制Lightning Attention-2:无限序列长度、恒定算力开销、更高建模精度

新一代注意力机制Lightning Attention-2:无限序列长度、恒定算力开销、更高建模精度
Lightning Attention-2 是一种新型的线性注意力机制,让长序列的训练和推理成本与 1K 序列长度的一致。...
2024-01-18 · 浏览178次
三个臭皮匠顶个诸葛亮?可能是真的,已证实混合多个小模型性能比肩GPT3.5

三个臭皮匠顶个诸葛亮?可能是真的,已证实混合多个小模型性能比肩GPT3.5

三个臭皮匠顶个诸葛亮?可能是真的,已证实混合多个小模型性能比肩GPT3.5
对模型参数量的迷信、执念也许可以放下了,混合多个小模型也是未来构造对话型 AI 的一个光明的方向。...
2024-01-18 · 浏览168次
模型越大,性能越好?苹果自回归视觉模型AIM:没错

模型越大,性能越好?苹果自回归视觉模型AIM:没错

模型越大,性能越好?苹果自回归视觉模型AIM:没错
视觉模型,同样遵循「参数越多性能越强」的规律?刚刚,一项来自苹果公司的研究验证了这个猜想。...
2024-01-18 · 浏览131次
奥数能力金牌级:DeepMind几何推理模型登上Nature,代码开源,菲尔兹奖得主点赞

奥数能力金牌级:DeepMind几何推理模型登上Nature,代码开源,菲尔兹奖得主点赞

奥数能力金牌级:DeepMind几何推理模型登上Nature,代码开源,菲尔兹奖得主点赞
这一次,人工智能算法在数学奥林匹克竞赛(IMO)上取得了重大成绩突破。...
2024-01-18 · 浏览179次
OpenAI 阿尔特曼回应被《纽约时报》起诉:AI 不用新闻出版商提供训练数据

OpenAI 阿尔特曼回应被《纽约时报》起诉:AI 不用新闻出版商提供训练数据

OpenAI 阿尔特曼回应被《纽约时报》起诉:AI 不用新闻出版商提供训练数据
在当地时间周二的达沃斯世界经济论坛年会上,OpenAI 首席执行官萨姆・阿尔特曼在回应有关其公司盗用版权材料的指控时表示,AI 并不需要《纽约时报》等新闻出版商提供大量的训练数...
2024-01-18 · 浏览137次
商汤“书生・浦语”2.0 大语言模型开源:200K 上下文,一次可读 30 万汉字

商汤“书生・浦语”2.0 大语言模型开源:200K 上下文,一次可读 30 万汉字

商汤“书生・浦语”2.0 大语言模型开源:200K 上下文,一次可读 30 万汉字
商汤科技与上海 AI 实验室联合香港中文大学和复旦大学今日发布了新一代大语言模型书生・浦语 2.0(InternLM2)。据介绍,InternLM2 是在 2.6 万亿 tok...
2024-01-18 · 浏览363次
Tokenization 指南:字节对编码,WordPiece等方法Python代码详解

Tokenization 指南:字节对编码,WordPiece等方法Python代码详解

Tokenization 指南:字节对编码,WordPiece等方法Python代码详解
在2022年11月OpenAI的ChatGPT发布之后,大型语言模型(llm)变得非常受欢迎。从那时起,这些语言模型的使用得到了爆炸式的发展,这在一定程度上得益于Hugging...
2024-01-18 · 浏览496次
七个值得关注的优秀大语言模型(LLM)

七个值得关注的优秀大语言模型(LLM)

七个值得关注的优秀大语言模型(LLM)
在开源生态中涌现了许多优秀的LLM预练模型,这些模型有着各自的亮点。本文主要介绍目前为止(2024年1月)几个值得关注的大开源LLM。...
2024-01-18 · 浏览614次
AI PC热再现CES2024,行业求解落地路线

AI PC热再现CES2024,行业求解落地路线

AI PC热再现CES2024,行业求解落地路线
过去一年,我们见证了 ChatGPT 引爆生成式 AI。既然可以在云端花近百亿人民币创建一个万亿参数的模型,那么,如何让无数消费者使用它呢?作为全球最大的科技硬件博览会,塞进大...
2024-01-18 · 浏览195次
蚂蚁集团开源新算法,可助大模型推理提速2-6倍

蚂蚁集团开源新算法,可助大模型推理提速2-6倍

蚂蚁集团开源新算法,可助大模型推理提速2-6倍
效果无损,即插即用,蚂蚁集团开源新算法提升大模型推理速度...
2024-01-18 · 浏览206次
Nature 子刊 | 化学家和机器人都可以读懂,用于机器人合成可重复性的通用化学编程语言

Nature 子刊 | 化学家和机器人都可以读懂,用于机器人合成可重复性的通用化学编程语言

Nature 子刊 | 化学家和机器人都可以读懂,用于机器人合成可重复性的通用化学编程语言
来自加拿大不列颠哥伦比亚大学(UBC)和英国格拉斯哥大学的研究团队,提出了一种方法,使用通用化学编程语言(χDL)在两个实验室的四种不同硬件系统上编码和执行各种化学反应的合成程...
2024-01-18 · 浏览151次
ChatGPT 高级技巧你必须知道

ChatGPT 高级技巧你必须知道

ChatGPT 高级技巧你必须知道
ChatGPT,由 OpenAI 的GPT-3.5架构提供支持,已经彻底改变了我们与人工智能的互动方式。这个先进的语言模型被证明是一种多功能工具,能够处理各种各样的对话任务。
2024-01-18 · 浏览162次
第一页 · 上一页 · 下一页 · 当前第115页