GeekAI - AI 大语言模型开源解决方案

作者:Jam 发布时间: December 2, 2025 分类:技术 No Comments

一款采用 Go + Vue3 + element-plus 实现的 AI 大语言模型开源解决方案「GeekAI」集成了 GPT、Azure、ChatGLM、讯飞星火、文心一言等多个平台的大语言模型。AI 助手全套开源解决方案，自带运营管理后台，开箱即用。 20251201-3

>>展开阅读

GELab-Zero - 阶跃团队开源的端侧多模态GUI Agent模型

作者:Jam 发布时间: December 2, 2025 分类:技术 No Comments

GELab-Zero是阶跃团队开源的端侧多模态GUI Agent模型，基于Qwen3-VL-4B-Instruct基座模型构建，参数量为4B。能识别UI元素并执行点击、滑动等操作，支持跨应用任务处理（如外卖、出行等场景），具备零样本适应能力，可适配未见过的App。模型采用Apache 2.0协议开源，支持Ollama快速启动，自动处理ADB连接和依赖安装，提供任务录制回放功能。在AndroidDaily基准测试中，准确率达73.4%，性能超越同尺寸主流模型，优于参数量更大的GUI-Owl-32B。

>>展开阅读

Depth Anything 3 - 字节跳动Seed开源的3D视觉重建模型

作者:Jam 发布时间: November 30, 2025 分类:技术 No Comments

Depth Anything 3（DA3）是字节跳动Seed团队研发开源的3D视觉重建模型。通过单一Transformer架构实现任意视角下的空间几何重建，仅需预测深度图和射线图即可还原三维场景，相比传统方法精度提升35.7%，运行效率达126 FPS。其创新点在于采用"深度-射线"统一表征法，无需多任务模块，支持从单张图片到多视角视频的灵活处理，能适配自动驾驶、SLAM等场景。模型在视觉几何基准测试中全面超越现有方法，相关代码和演示已公开。 Depth Anything 3 - 字节跳动Seed开源的3D视觉重建模型

>>展开阅读

DeepSeek-Math-V2 - DeepSeek开源的数学推理模型

作者:Jam 发布时间: November 30, 2025 分类:技术 No Comments

DeepSeek-Math-V2是幻方旗下AI公司DeepSeek开源的数学推理模型，最新版本基于DeepSeek-V3.2-Exp-Base改进，性能超越Gemini DeepThink，达到国际数学奥林匹克（IMO）金牌水平。模型采用多头潜在注意力（MLA）技术大幅降低推理显存消耗，通过递归定理证明管道结合非形式化与形式化推理，解决了Minif2F测试88.9%的问题。其配套开源数据集ProverBench包含325道高中至本科难度数学题，涵盖数论、代数等10个领域。<a class="js" DeepSeek-Math-V2 - DeepSeek开源的数学推理模型

>>展开阅读

一个牛逼的插件，国内用户可以免费用Grok4（附教程）

作者:Jam 发布时间: November 28, 2025 分类:技术 No Comments

马斯克的背水一战，大获全胜！2025年最值得期待的AI模型——Grok 4，终于来了！北京时间7月10日，马斯克旗下的人工智能公司xAI正式发布了Grok 4。这是Grok系列模型的第四次重要迭代，号称是“世界上最强AI模型”。根据官方的描述，Grok  4具备“逻辑推理更强、语言理解更准确”的优势，在处理学术问题上的表现，已达到博士级别。

>>展开阅读

Depth Anything 3 - 字节跳动Seed开源的3D视觉重建模型

作者:Jam 发布时间: November 28, 2025 分类:技术 No Comments

Depth Anything 3（DA3）是字节跳动Seed团队研发开源的3D视觉重建模型。通过单一Transformer架构实现任意视角下的空间几何重建，仅需预测深度图和射线图即可还原三维场景，相比传统方法精度提升35.7%，运行效率达126 FPS。其创新点在于采用"深度-射线"统一表征法，无需多任务模块，支持从单张图片到多视角视频的灵活处理，能适配自动驾驶、SLAM等场景。模型在视觉几何基准测试中全面超越现有方法，相关代码和演示已公开 Depth Anything 3 - 字节跳动Seed开源的3D视觉重建模型

>>展开阅读

Z-Image - 阿里通义实验室开源的图像生成模型

作者:Jam 发布时间: November 28, 2025 分类:技术 No Comments

Z-Image是阿里通义实验室开源的图像生成模型，具有高效、快速和强大的图像生成能力。采用单流扩散Transformer架构（S3-DiT），将文本、视觉语义和图像VAE token整合为统一输入流，最大化参数效率。其核心技术创新包括解耦分布匹配蒸馏（Decoupled-DMD）和强化学习与分布匹配蒸馏融合（DMDR），显著提升少步生成性能和图像质量。Z-Image-Turbo版本仅需8次函数评估就能生成高质量图像，支持亚秒级推理延迟，适配低显存设备，擅长照片级真实感图像生成和双语文本渲染。Z-Image-Edit版本专注于图像编辑任务，可依据自然语言提示进行精确编辑。Z-Image-Base是未经蒸馏的基础模型，为社区提供更广泛的微调和定制开发空间 Z-Image - 阿里通义实验室开源的图像生成模型

>>展开阅读

ROCK - 阿里巴巴开源的智能体训练环境沙箱

作者:Jam 发布时间: November 28, 2025 分类:技术 No Comments

ROCK（Reinforcement Open Construction Kit）是阿里巴巴开源的智能体训练环境沙箱，解决智能体在真实环境中无法规模化训练的难题。ROCK 提供了高稳定的沙箱管理服务，每个智能体（Agent）都有独立的“安全屋”，互不干扰，即使某个环境崩溃，也不会影响其他环境。具备全方位健康监控、智能负载均衡、自动故障恢复等功能，确保训练过程稳定高效。ROCK 与阿里此前的强化学习（RL）训练框架 ROLL 深度协同，构成完整的智能体训练闭环。ROLL 负责训练算法，而 ROCK 提供训练环境，让开发者能从单机实验无缝扩展到大规模集群训练。 ROCK - 阿里巴巴开源的智能体训练环境沙箱

>>展开阅读

Jam's Blog II

JamLee.Life 心情演绎

GeekAI - AI 大语言模型开源解决方案

GELab-Zero - 阶跃团队开源的端侧多模态GUI Agent模型

Depth Anything 3 - 字节跳动Seed开源的3D视觉重建模型

DeepSeek-Math-V2 - DeepSeek开源的数学推理模型

一个牛逼的插件，国内用户可以免费用Grok4（附教程）

Depth Anything 3 - 字节跳动Seed开源的3D视觉重建模型

Z-Image - 阿里通义实验室开源的图像生成模型

ROCK - 阿里巴巴开源的智能体训练环境沙箱