端到端优化所有能力,字节跳动提出强化学习LLM Agent框架AGILE
该框架下,Agent 能够拥有记忆、工具使用、规划、反思、与外界环境交互、主动求助专家等多种能力,并且通过强化学习实现所有能力的端到端训练。...
2024-10-01
·
浏览117次
英伟达性能怪兽RTX 5090最新泄露!21760个CUDA核心,32GB显存,512 bit位宽
英伟达性能怪兽RTX 5090最新泄露!21760个CUDA核心,32GB显存,512 bit位宽...
2024-09-30
·
浏览65次
美国加州州长否决人工智能安全法案 SB 1047
美国加州州长加文・纽森(Gavin Newsom)今日否决了具有争议的《前沿人工智能模型安全创新法案》(简称 SB 1047),他在否决消息中提到了多个影响他决定的因素,包括该...
2024-09-30
·
浏览91次
Ilya预言错了!华人Nature一作给RLHF「判死刑」,全球大模型都不可靠
Ilya预言错了!华人Nature一作给RLHF「判死刑」,全球大模型都不可靠...
2024-09-29
·
浏览93次
《Python机器学习》作者科普长文:从头构建类GPT文本分类器,代码开源
近日,机器学习研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 又分享了一篇长文,主题为《从头开始构建一个 GPT 风格的 LLM 分类器》。...
2024-09-29
·
浏览122次
用大模型优化大模型预训练数据,节省20倍计算量,实现显著性能提升!
Program-Every-Example (ProX) 是上海交通大学生成式人工智能实验室 (GAIR Lab) 、上海人工智能实验室、新加坡 Sea AI Lab 联合研究...
2024-09-28
·
浏览145次
Layout工程师危,谷歌自动芯片设计AlphaChip问世,开放权重可外部定制
2020 年,谷歌发表了预印本论文《Chip Placement with Deep Reinforcement Learning》,介绍了其设计芯片布局的新型强化学习方法。...
2024-09-28
·
浏览115次