头条
DeepSeek-R2
https://deepseek.ai/blog/deepseek-r2-ai-model-launch-2025
DeepSeek推出了DeepSeek-R2,这是一款多语言且资源利用高效的模型,旨在挑战全球人工智能领域的领军者。
XAI筹集200亿美元资金
马斯克旗下的xAI控股公司,目标是成为历史上最大的私人投资科技企业之一,据悉正寻求200亿美元资金。
极简 MCP 驱动智能体实现方案
https://huggingface.co/blog/tiny-agents
一份操作指南,教你如何仅用50行TypeScript代码构建一个紧凑的由MCP驱动的智能体。
如何更快地调试机器学习部署
https://decodingml.substack.com/p/how-to-debug-ml-deployments-20x-faster
本指南展示了一种高效的本地测试流程,旨在加快模型部署调试速度。
大语言模型竞技场帕累托前沿
https://winston-bosan.github.io/llm-pareto-frontier/
该图表对大语言模型(LLMs)的性能和成本进行了比较。性价比最高的模型有亚马逊Nova Micro、亚马逊Nova Lite、Gemini 2.0 Flash Lite、Gemini 2.0 Flash 001、Gemini 2.5 Flash和Gemini 2.5 Pro 。
工程
轻量级神经应用程序控制
https://arxiv.org/abs/2410.17883
华为提出一种有趣方法,能让视觉语言模型(VLMs)在安卓设备上只需极少额外系统设置就能控制应用程序 。
认知诊断
https://arxiv.org/abs/2410.17564v1
DisenGCD是一种认知诊断模型,它通过使用解耦图学习框架,改进学生、练习和概念表征的学习。
PIPPO:从单张图像中生成高分辨率多视角人体(GitHub 仓库)
https://github.com/facebookresearch/pippo
虚拟人类创建训练系统(无预训练模型),可将图像作为输入,并输出高质量的人物3D模型。
其他
弹性人工智能基础设施
https://www.harvey.ai/blog/resilient-ai-infrastructure
哈维使用一个集中式Python库来管理人工智能模型交互,通过主动负载均衡和实时监控确保可靠部署。它实现了一个分布式速率限制系统,以处理突发流量并在实现无缝模型升级的同时保持性能。该设置增强了安全性,优化了资源利用,并支持快速部署、性能跟踪和故障检测,以提供一致的用户体验。
Character.AI推出AvatarFX,一款用于创建逼真聊天机器人的人工智能视频模型
Character.AI的AvatarFX是一个视频生成模型,能让人工智能生成的角色动起来,还能根据现有图像创作视频。这项技术虽前景可期,但引发了对潜在滥用的担忧,尤其是在制作深度伪造内容方面。Character.AI的平台已面临安全问题,有诉讼称其聊天机器人助长了有害行为。
高中生的人工智能设备可防止酒驾
https://spectrum.ieee.org/students-device-deters-drunk-driving
北卡罗来纳州的高中生为防止酒驾,打造了SoberRide。这是一款由人工智能驱动的设备,利用摄像头、传感器和机器学习技术,检测司机的酒精影响迹象。该团队已获得美国专利,还与“母亲反对酒驾”等组织合作,在国际消费电子展上也引起了各大汽车制造商的关注。他们正倡导立法强制汽车安装酒驾检测系统,目标是让车队运营商和家长率先采用。
英国DeepMind工会化
https://links.tldrnewsletter.com/EvTUi1
约300名伦敦的DeepMind员工因对道德承诺以及与军事组织的合作感到担忧,正着手组建工会。
OpenAI为开发者推出图像生成API
https://links.tldrnewsletter.com/QG0vBx
OpenAI推出了一个API,可将DALL·E图像生成功能集成到应用程序和工作流程中。
这个人工智能模型能惊恐地疯狂尖叫。
https://decrypt.co/316008/ai-model-scream-hysterically-terror
纳里实验室的Dia-1.6B是一款小型开源人工智能,号称在情感语音合成方面超越了ElevenLabs和芝麻。