天机亘古

最新文章

全部

企业系列

全部

家庭系列

全部

成长系列

全部

RAG框架

全部
  • DeepSeek-R1 介绍 [译]

    DeepSeek-R1 介绍 [译] 2025-02-02 17:44

    原文 DeepSeek-AI 团队推出的 DeepSeek-R1 是一款强化学习驱动的推理模型系列,旨在提升数学、代码和推理能力。DeepSeek-R1 及其前身 DeepSeek-R1-Zero 采用了 大规模强化学习(RL) 训练策略,其中 DeepSeek-R1-Zero 是首个未经监督微调(

  • 运行DeepSeek-R1动态 1.58-bit 量化项目

    运行DeepSeek-R1动态 1.58-bit 量化项目 2025-02-05 09:59

    这个由Unsloth团队开发的DeepSeek-R1量化项目展现了三大技术突破: 1. 混合精度量化创新 首创1.58-bit动态量化技术,通过分层处理策略:对关键层(如MoE专家层)采用1.5-bit超低精度,其他层保留4-bit精度 开发重要性矩阵校准算法(imatrix),突破传统均匀量化限制

  • Nvidia Project DIGITS:桌面AI超级计算机的革命进化

    Nvidia Project DIGITS:桌面AI超级计算机的革命进化 2025-02-04 16:21

    Project DIGITS:将AI超级计算机带入个人领域 Project DIGITS将AI超级计算机带入个人领域,让更多人能够参与AI研究与开发。 想象一下,一台可以放在桌面上的超级计算机,是不是像科幻小说里的情节?如今,Nvidia推出了一项突破性的技术——Project DIGITS,这是一

  • 我们在 2024 年从大型语言模型中学到的事

    我们在 2024 年从大型语言模型中学到的事 2025-01-07 08:22

    原文:我们在 2024 年从大型语言模型中学到的事 稍作编辑 英文原文:Things we learned about LLMs in 2024 2024 年,大型语言模型领域发生了很多事情。接下来是对过去十二个月里我们对该领域所了解内容的回顾,以及我对其中关键主题和重大时刻的梳理。这篇文章是我