GeekAI - AI 大语言模型开源解决方案

一款采用 Go + Vue3 + element-plus 实现的 AI 大语言模型开源解决方案「GeekAI」集成了 GPT、Azure、ChatGLM、讯飞星火、文心一言等多个平台的大语言模型。AI 助手全套开源解决方案,自带运营管理后台,开箱即用。20251201-3

>>展开阅读

GELab-Zero - 阶跃团队开源的端侧多模态GUI Agent模型

GELab-Zero是阶跃团队开源的端侧多模态GUI Agent模型,基于Qwen3-VL-4B-Instruct基座模型构建,参数量为4B。能识别UI元素并执行点击、滑动等操作,支持跨应用任务处理(如外卖、出行等场景),具备零样本适应能力,可适配未见过的App。模型采用Apache 2.0协议开源,支持Ollama快速启动,自动处理ADB连接和依赖安装,提供任务录制回放功能。在AndroidDaily基准测试中,准确率达73.4%,性能超越同尺寸主流模型,优于参数量更大的GUI-Owl-32B。1764558863-1764558863-GELab-Zero-website-1.png

>>展开阅读

Depth Anything 3 - 字节跳动Seed开源的3D视觉重建模型

Depth Anything 3(DA3)是字节跳动Seed团队研发开源的3D视觉重建模型。通过单一Transformer架构实现任意视角下的空间几何重建,仅需预测深度图和射线图即可还原三维场景,相比传统方法精度提升35.7%,运行效率达126 FPS。其创新点在于采用"深度-射线"统一表征法,无需多任务模块,支持从单张图片到多视角视频的灵活处理,能适配自动驾驶、SLAM等场景。模型在视觉几何基准测试中全面超越现有方法,相关代码和演示已公开。Depth Anything 3 - 字节跳动Seed开源的3D视觉重建模型

>>展开阅读

DeepSeek-Math-V2 - DeepSeek开源的数学推理模型

DeepSeek-Math-V2是幻方旗下AI公司DeepSeek开源的数学推理模型,最新版本基于DeepSeek-V3.2-Exp-Base改进,性能超越Gemini DeepThink,达到国际数学奥林匹克(IMO)金牌水平。模型采用多头潜在注意力(MLA)技术大幅降低推理显存消耗,通过递归定理证明管道结合非形式化与形式化推理,解决了Minif2F测试88.9%的问题。其配套开源数据集ProverBench包含325道高中至本科难度数学题,涵盖数论、代数等10个领域。<a class="js" DeepSeek-Math-V2 - DeepSeek开源的数学推理模型

>>展开阅读

一个牛逼的插件,国内用户可以免费用Grok4(附教程)

马斯克的背水一战,大获全胜!2025年最值得期待的AI模型——Grok 4,终于来了!北京时间7月10日,马斯克旗下的人工智能公司xAI正式发布了Grok 4。这是Grok系列模型的第四次重要迭代,号称是“世界上最强AI模型”。根据官方的描述,Grok  4具备“逻辑推理更强、语言理解更准确”的优势,在处理学术问题上的表现,已达到博士级别。

>>展开阅读

Depth Anything 3 - 字节跳动Seed开源的3D视觉重建模型

Depth Anything 3(DA3)是字节跳动Seed团队研发开源的3D视觉重建模型。通过单一Transformer架构实现任意视角下的空间几何重建,仅需预测深度图和射线图即可还原三维场景,相比传统方法精度提升35.7%,运行效率达126 FPS。其创新点在于采用"深度-射线"统一表征法,无需多任务模块,支持从单张图片到多视角视频的灵活处理,能适配自动驾驶、SLAM等场景。模型在视觉几何基准测试中全面超越现有方法,相关代码和演示已公开Depth Anything 3 - 字节跳动Seed开源的3D视觉重建模型

>>展开阅读

Z-Image - 阿里通义实验室开源的图像生成模型

Z-Image是阿里通义实验室开源的图像生成模型,具有高效、快速和强大的图像生成能力。采用单流扩散Transformer架构(S3-DiT),将文本、视觉语义和图像VAE token整合为统一输入流,最大化参数效率。其核心技术创新包括解耦分布匹配蒸馏(Decoupled-DMD)和强化学习与分布匹配蒸馏融合(DMDR),显著提升少步生成性能和图像质量。Z-Image-Turbo版本仅需8次函数评估就能生成高质量图像,支持亚秒级推理延迟,适配低显存设备,擅长照片级真实感图像生成和双语文本渲染。Z-Image-Edit版本专注于图像编辑任务,可依据自然语言提示进行精确编辑。Z-Image-Base是未经蒸馏的基础模型,为社区提供更广泛的微调和定制开发空间Z-Image - 阿里通义实验室开源的图像生成模型

>>展开阅读

ROCK - 阿里巴巴开源的智能体训练环境沙箱

ROCK(Reinforcement Open Construction Kit) 是阿里巴巴开源的智能体训练环境沙箱,解决智能体在真实环境中无法规模化训练的难题。ROCK 提供了高稳定的沙箱管理服务,每个智能体(Agent)都有独立的“安全屋”,互不干扰,即使某个环境崩溃,也不会影响其他环境。具备全方位健康监控、智能负载均衡、自动故障恢复等功能,确保训练过程稳定高效。ROCK 与阿里此前的强化学习(RL)训练框架 ROLL 深度协同,构成完整的智能体训练闭环。ROLL 负责训练算法,而 ROCK 提供训练环境,让开发者能从单机实验无缝扩展到大规模集群训练。ROCK - 阿里巴巴开源的智能体训练环境沙箱

>>展开阅读