models 标签,匹配到约114个结果, 耗时0.0627秒
支持 100 万 Tokens 上下文,阿里通义千问推出 Qwen2.5-1M 开源模型
通义千问本次发布了两个新的开源模型,分别是 Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M,这是通义千问首次将开源的 Qwen...
2025-01-27
·
浏览33次
选择/杂交/突变,DeepMind将自然选择引入LLM思维,实现心智进化
今天是个好日子,DeepSeek 与 Kimi 都更新了最新版的推理模型,吸引了广泛关注。...
2025-01-22
·
浏览80次
LLM 带来了「编程末日」?哥本哈根大学计算机教授称“永远不会”
LLM 会把编程淘汰吗?近日,哥本哈根大学的计算机教授,通过分析计算理论中的定理所施加的基本限制,得出结论:距离编程的终结还远得很。...
2025-01-12
·
浏览65次
Just keep scaling!思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式
关注 AI 领域的人对 Jason Wei 这个名字一定不陌生。...
2025-01-04
·
浏览79次
LeCun八年前神预言,大模型路线再颠覆?OpenAI宣告:强化学习取得稳定性突破
LeCun八年前神预言,大模型路线再颠覆?OpenAI宣告:强化学习取得稳定性突破...
2024-12-23
·
浏览112次
刚刚,OpenAI元老级研究员Alec Radford离职,他主导了GPT-1、GPT-2的研发
OpenAI 连续 12 天发布会还剩最后一天,期待中的「重磅」迟迟没来,反而失去了一位核心研究人员。...
2024-12-21
·
浏览158次
Ilya错了,预训练没结束!LeCun等反击,「小模型时代」让奥特曼预言成真
Ilya错了,预训练没结束!LeCun等反击,「小模型时代」让奥特曼预言成真...
2024-12-16
·
浏览161次