Mamba真比Transformer更优吗?Mamba原作者:两个都要!混合架构才是最优解

Mamba真比Transformer更优吗?Mamba原作者:两个都要!混合架构才是最优解

Mamba真比Transformer更优吗?Mamba原作者:两个都要!混合架构才是最优解
Mamba真比Transformer更优吗?Mamba原作者:两个都要!混合架构才是最优解...
2024-07-13 · 浏览1277次
OpenAI机密五级AGI路线图曝光!GPT-4仍处L1,内部AI接近博士水平18个月诞生

OpenAI机密五级AGI路线图曝光!GPT-4仍处L1,内部AI接近博士水平18个月诞生

OpenAI机密五级AGI路线图曝光!GPT-4仍处L1,内部AI接近博士水平18个月诞生
OpenAI机密五级AGI路线图曝光!GPT-4仍处L1,内部AI接近博士水平18个月诞生...
2024-07-12 · 浏览949次
首届AI奥数竞赛方案公布:4支获奖队伍,竟都选择国产模型DeepSeekMath

首届AI奥数竞赛方案公布:4支获奖队伍,竟都选择国产模型DeepSeekMath

首届AI奥数竞赛方案公布:4支获奖队伍,竟都选择国产模型DeepSeekMath
获胜的 AI 数学奥林匹克模型出炉!...
2024-07-12 · 浏览539次
微软苹果与OpenAI「分道扬镳」,纷纷放弃董事会席位

微软苹果与OpenAI「分道扬镳」,纷纷放弃董事会席位

微软苹果与OpenAI「分道扬镳」,纷纷放弃董事会席位
微软苹果与OpenAI「分道扬镳」,纷纷放弃董事会席位...
2024-07-11 · 浏览511次
CVPR世界第二仅次Nature!谷歌2024学术指标出炉,NeurIPS、ICLR跻身前十

CVPR世界第二仅次Nature!谷歌2024学术指标出炉,NeurIPS、ICLR跻身前十

CVPR世界第二仅次Nature!谷歌2024学术指标出炉,NeurIPS、ICLR跻身前十
CVPR世界第二仅次Nature!谷歌2024学术指标出炉,NeurIPS、ICLR跻身前十...
2024-07-11 · 浏览1908次
Llama分子嵌入优于GPT,LLM能理解分子吗?这一局Meta赢了OpenAI

Llama分子嵌入优于GPT,LLM能理解分子吗?这一局Meta赢了OpenAI

Llama分子嵌入优于GPT,LLM能理解分子吗?这一局Meta赢了OpenAI
加拿大温莎大学(University of Windsor)的研究人员比较了 GPT 和 Llama 与 SMILES 上的预训练模型在下游任务中嵌入 SMILES 字符串的性...
2024-07-11 · 浏览618次
精度媲美AlphaFold,EPFL的AI方法从序列中匹配蛋白质互作

精度媲美AlphaFold,EPFL的AI方法从序列中匹配蛋白质互作

精度媲美AlphaFold,EPFL的AI方法从序列中匹配蛋白质互作
洛桑联邦理工学院(École Polytechnique Fédérale de Lausanne,EPFL)的 Anne-Florence Bitbol 团队提出了一种配对相...
2024-07-11 · 浏览550次
没想到!AlphaZero式树搜索也能用来增强大语言模型推理与训练

没想到!AlphaZero式树搜索也能用来增强大语言模型推理与训练

没想到!AlphaZero式树搜索也能用来增强大语言模型推理与训练
2016年 DeepMind 的 AlphaZero 展示了强大的学习和适应能力,登上《自然》杂志封面...
2024-07-10 · 浏览768次
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆

鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆

鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
2.4B 的 Memory3比更大的 LLM 和 RAG 模型获得了更好的性能。...
2024-07-10 · 浏览519次
单一作者论文,谷歌提出百万专家Mixture,超越密集前馈、稀疏MoE

单一作者论文,谷歌提出百万专家Mixture,超越密集前馈、稀疏MoE

单一作者论文,谷歌提出百万专家Mixture,超越密集前馈、稀疏MoE
释放进一步扩展 Transformer 的潜力,同时还可以保持计算效率。...
2024-07-10 · 浏览544次
WAIC观察:隐私计算加速落地产业,全新的技术标准体系呼之欲出

WAIC观察:隐私计算加速落地产业,全新的技术标准体系呼之欲出

WAIC观察:隐私计算加速落地产业,全新的技术标准体系呼之欲出
这几年,人们都在谈论大模型。...
2024-07-10 · 浏览586次
LeCun转发,首个半导体设计开源大模型SemiKong问世,重塑芯片制造流程

LeCun转发,首个半导体设计开源大模型SemiKong问世,重塑芯片制造流程

LeCun转发,首个半导体设计开源大模型SemiKong问世,重塑芯片制造流程
终于,半导体设计行业有了专属的开源大模型!...
2024-07-10 · 浏览602次
AlphaFold 3 向解码分子行为和生物计算迈出重要一步,Nature 子刊锐评

AlphaFold 3 向解码分子行为和生物计算迈出重要一步,Nature 子刊锐评

AlphaFold 3 向解码分子行为和生物计算迈出重要一步,Nature 子刊锐评
最近推出的 AlphaFold 3 可以直接从蛋白质、核酸及其配体的序列中预测生物分子复合物的 3D 结构。这标志着我们在长期探索生物分子如何相互作用方面取得了重大进展。...
2024-07-10 · 浏览491次
藏身幕后的巨人,正将工业AI带入下一阶段

藏身幕后的巨人,正将工业AI带入下一阶段

藏身幕后的巨人,正将工业AI带入下一阶段
工业 AI ,没有新王,光而无耀,静水深流。...
2024-07-10 · 浏览367次
OpenAI「突拔网线」,国内大厂笑疯!泼天流量来了,微软急伸橄榄枝

OpenAI「突拔网线」,国内大厂笑疯!泼天流量来了,微软急伸橄榄枝

OpenAI「突拔网线」,国内大厂笑疯!泼天流量来了,微软急伸橄榄枝
OpenAI「突拔网线」,国内大厂笑疯!泼天流量来了,微软急伸橄榄枝...
2024-07-10 · 浏览500次
LeCun新作:神经网络在实践中的灵活性到底有多大?

LeCun新作:神经网络在实践中的灵活性到底有多大?

LeCun新作:神经网络在实践中的灵活性到底有多大?
LeCun新作:神经网络在实践中的灵活性到底有多大?...
2024-07-10 · 浏览393次
全球247亿美元豪赌GenAI,疯狂入局AI成高风险博弈?

全球247亿美元豪赌GenAI,疯狂入局AI成高风险博弈?

全球247亿美元豪赌GenAI,疯狂入局AI成高风险博弈?
全球247亿美元豪赌GenAI,疯狂入局AI成高风险博弈?...
2024-07-10 · 浏览432次
全球首个芯片设计开源大模型诞生!5年重塑5000亿美元半导体行业

全球首个芯片设计开源大模型诞生!5年重塑5000亿美元半导体行业

全球首个芯片设计开源大模型诞生!5年重塑5000亿美元半导体行业
全球首个芯片设计开源大模型诞生!5年重塑5000亿美元半导体行业...
2024-07-10 · 浏览429次
单卡A100实现百万token推理,速度快10倍,这是微软官方的大模型推理加速

单卡A100实现百万token推理,速度快10倍,这是微软官方的大模型推理加速

单卡A100实现百万token推理,速度快10倍,这是微软官方的大模型推理加速
微软的这项研究让开发者可以在单卡机器上以 10 倍的速度处理超过 1M 的输入文本。...
2024-07-10 · 浏览753次
像生物网络一样「生长」,具备「结构可塑性」的自组织神经网络来了

像生物网络一样「生长」,具备「结构可塑性」的自组织神经网络来了

像生物网络一样「生长」,具备「结构可塑性」的自组织神经网络来了
生物神经网络有一个重要的特点是高度可塑性,这使得自然生物体具有卓越的适应性,并且这种能力会影响神经系统的突触强度和拓扑结构。...
2024-07-10 · 浏览483次
Nature子刊,优于AlphaFold,全原子采样,一种预测肽结构的AI方法

Nature子刊,优于AlphaFold,全原子采样,一种预测肽结构的AI方法

Nature子刊,优于AlphaFold,全原子采样,一种预测肽结构的AI方法
多伦多大学的 Philip M. Kim 和 Osama Abdin 开发了 PepFlow,这是一种可转移生成模型,它能够从输入肽的允许构象空间中直接进行全原子采样。研究人员...
2024-07-10 · 浏览483次
OpenAI CEO 阿尔特曼成立 AI 健康公司,要做私人个性化 AI 健康教练

OpenAI CEO 阿尔特曼成立 AI 健康公司,要做私人个性化 AI 健康教练

OpenAI CEO 阿尔特曼成立 AI 健康公司,要做私人个性化 AI 健康教练
赫芬顿邮报创始人阿里安娜・赫芬顿(Arianna Huffington)和 OpenAI CEO 萨姆・阿尔特曼(Sam Altman)宣布联合创办一家名为 Thrive AI...
2024-07-09 · 浏览616次
从智算到密算,大模型数据困境新解法 | 智者访谈

从智算到密算,大模型数据困境新解法 | 智者访谈

从智算到密算,大模型数据困境新解法 | 智者访谈
大模型产业发展,需要可信中立的数据深加工平台,如何填补空白?...
2024-07-08 · 浏览663次
ChatGPT无法取代人类程序员! IEEE 35页论文测出困难编码正确率仅为0.66%

ChatGPT无法取代人类程序员! IEEE 35页论文测出困难编码正确率仅为0.66%

ChatGPT无法取代人类程序员! IEEE 35页论文测出困难编码正确率仅为0.66%
ChatGPT无法取代人类程序员! IEEE 35页论文测出困难编码正确率仅为0.66%...
2024-07-08 · 浏览566次
第一页 · 上一页 · 下一页 · 当前第330页