语言模型 标签,匹配到约13个结果, 耗时0.0419秒
麻省理工研究:生成式 AI 未能对世界形成连贯的理解

麻省理工研究:生成式 AI 未能对世界形成连贯的理解

麻省理工研究:生成式 AI 未能对世界形成连贯的理解
研究人员发现,一种流行的生成式 AI 模型能够在纽约市提供接近完美的逐步导航指引,但却并未真正形成该城市的精确地图。当研究人员封闭了某些街道并设置绕行路线时,模型的表现却大幅下...
2024-11-11 · 浏览63次
ChatGPT 真能记住你的话吗?DeepMind 与开源大佬揭示 LLM 记忆之谜

ChatGPT 真能记住你的话吗?DeepMind 与开源大佬揭示 LLM 记忆之谜

ChatGPT 真能记住你的话吗?DeepMind 与开源大佬揭示 LLM 记忆之谜
Django 框架的创始人之一、著名开发者 Simon Willison 最近发表了一篇博客文章,核心观点是 —— 虽然很多 LLM 看起来有记忆,但本质上是无状态函数。...
2024-06-02 · 浏览239次
字节跳动豆包大模型掀起价格战:主力模型比行业低 99.3%,日均处理千亿级 Tokens

字节跳动豆包大模型掀起价格战:主力模型比行业低 99.3%,日均处理千亿级 Tokens

字节跳动豆包大模型掀起价格战:主力模型比行业低 99.3%,日均处理千亿级 Tokens
豆包主力模型在企业市场的定价只有 0.0008 元 / 千 Tokens,0.8 厘就能处理 1500 多个汉字,比行业便宜 99.3%。...
2024-05-16 · 浏览337次
MiniMax 稀宇科技发布万亿参数 MoE 模型 abab 6.5,核心能力接近 GPT-4

MiniMax 稀宇科技发布万亿参数 MoE 模型 abab 6.5,核心能力接近 GPT-4

MiniMax 稀宇科技发布万亿参数 MoE 模型 abab 6.5,核心能力接近 GPT-4
abab 6.5 系列模型包含万亿参数的 abab 6.5 与更高效的 abab 6.5s,支持 200k tokens 的上下文长度,最快可 1 秒内处理近 3 万字的文本,...
2024-04-17 · 浏览313次
可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE
谷歌开发了一款 ASPIRE 训练框架,为 AI 模型引入了“可信度”机制,即 —— 模型会输出一系列答案,每个答案都会具有正确概率评分。该框架号称可以增强 AI 模型的选择性...
2024-01-24 · 浏览239次
Tokenization 指南:字节对编码,WordPiece等方法Python代码详解

Tokenization 指南:字节对编码,WordPiece等方法Python代码详解

Tokenization 指南:字节对编码,WordPiece等方法Python代码详解
在2022年11月OpenAI的ChatGPT发布之后,大型语言模型(llm)变得非常受欢迎。从那时起,这些语言模型的使用得到了爆炸式的发展,这在一定程度上得益于Hugging...
2024-01-18 · 浏览507次
七个值得关注的优秀大语言模型(LLM)

七个值得关注的优秀大语言模型(LLM)

七个值得关注的优秀大语言模型(LLM)
在开源生态中涌现了许多优秀的LLM预练模型,这些模型有着各自的亮点。本文主要介绍目前为止(2024年1月)几个值得关注的大开源LLM。...
2024-01-18 · 浏览635次
可协助 AI 语言模型改善自我纠错能力,谷歌推出 BIG-Bench Mistake 数据集

可协助 AI 语言模型改善自我纠错能力,谷歌推出 BIG-Bench Mistake 数据集

可协助 AI 语言模型改善自我纠错能力,谷歌推出 BIG-Bench Mistake 数据集
谷歌研究院日前使用自家 BIG-Bench 基准测试建立了一项“BIG-Bench Mistake”数据集,并利用相关数据集对市面上流行的语言模型“出错概率”及“纠错能力”进行...
2024-01-15 · 浏览191次
GPT-4 Turbo现在为Microsoft Copilot提供动力 —— 这里有如何检查你是否有访问权限的方法

GPT-4 Turbo现在为Microsoft Copilot提供动力 —— 这里有如何检查你是否有访问权限的方法

GPT-4 Turbo现在为Microsoft Copilot提供动力 —— 这里有如何检查你是否有访问权限的方法
GPT-4 Turbo语言模型的这种悄悄推出对于许多用户来说是一个惊喜,他们最近发现他们的生产力工具刚刚获得了功能上的显著提升。...
2024-01-14 · 浏览318次
大语言模型漏洞缓解指南

大语言模型漏洞缓解指南

大语言模型漏洞缓解指南
虽然大语言模型(LLM)应用正在全球快速普及,但企业对大语言模型的威胁态势仍然缺乏全面了解。面对大语言模型风险的不确定性,企业希望在保障其安全性的基础上加快应用脚步,用人工智能...
2024-01-12 · 浏览308次
使用 OpenLLM 构建和部署大模型应用

使用 OpenLLM 构建和部署大模型应用

使用 OpenLLM 构建和部署大模型应用
OpenLLM 是一个开源的大语言模型(LLM)开发框架。它支持多种开源的 LLM 模型,并且具有内建的两个关键的 LLM 优化,能够优化内存使用。此外,它与 LangChai...
2024-01-05 · 浏览252次
苹果取得技术突破:有望在 iPhone 上运行大型语言模型

苹果取得技术突破:有望在 iPhone 上运行大型语言模型

苹果取得技术突破:有望在 iPhone 上运行大型语言模型
苹果的人工智能研究人员表示,他们已取得一项重大突破,通过一种创新的闪存利用技术,成功地在内存有限的 iPhone 和其他苹果设备上部署了大型语言模型(LLM)。这一成果有望让更...
2023-12-23 · 浏览177次
第一页 · 上一页 · 下一页 · 当前第1页