DeepSeek-R1 介绍 [译]
原文 DeepSeek-AI 团队推出的 DeepSeek-R1 是一款强化学习驱动的推理模型系列,旨在提升数学、代码和推理能力。DeepSeek-R1 及其前身 DeepSeek-R1-Zero 采用了 大规模强化学习(RL) 训练策略,其中 DeepSeek-R1-Zero 是首个未经监督微调(
运行DeepSeek-R1动态 1.58-bit 量化项目
这个由Unsloth团队开发的DeepSeek-R1量化项目展现了三大技术突破: 1. 混合精度量化创新 首创1.58-bit动态量化技术,通过分层处理策略:对关键层(如MoE专家层)采用1.5-bit超低精度,其他层保留4-bit精度 开发重要性矩阵校准算法(imatrix),突破传统均匀量化限制
Nvidia Project DIGITS:桌面AI超级计算机的革命进化
Project DIGITS:将AI超级计算机带入个人领域 Project DIGITS将AI超级计算机带入个人领域,让更多人能够参与AI研究与开发。 想象一下,一台可以放在桌面上的超级计算机,是不是像科幻小说里的情节?如今,Nvidia推出了一项突破性的技术——Project DIGITS,这是一
我们在 2024 年从大型语言模型中学到的事
原文:我们在 2024 年从大型语言模型中学到的事 稍作编辑 英文原文:Things we learned about LLMs in 2024 2024 年,大型语言模型领域发生了很多事情。接下来是对过去十二个月里我们对该领域所了解内容的回顾,以及我对其中关键主题和重大时刻的梳理。这篇文章是我
2024 AI 智能体现状 [译]
State of AI Agents 我们对超过 1300 名专业人士进行了调查——包括工程师、产品经理、业务领导和高管——以了解 AI 智能体的现状。以下是数据分析,揭示了今天 AI 智能体的使用(或未被使用)情况。 引言 2024 年,AI 智能体不再是小众兴趣。各行业的公司正愈发严肃地将智能体
LangChain 2023年人工智能发展报告 [译]
阅读时间:7分钟 发布日期:2023年12月21日 2023年,随着ChatGPT的推出,生成式人工智能的关注度爆炸式增长。从初创公司到企业,各类公司都在尝试制定自己的生成式人工智能(GenAI)战略。 “我们如何将生成式人工智能融入我们的产品?” “我们应该遵循哪些参考架构?” “哪些模型最适合我
LangChain 2024年人工智能发展报告 [译]
深入探讨LangSmith产品使用模式,揭示AI生态系统及人们构建LLM应用的方式如何演变。 作者:LangChain 阅读时间:6分钟 发布日期:2024年12月19日 又一年的LLM构建即将结束,而2024年同样不负期待。每月有近3万用户注册使用LangSmith,我们得以站在行业发展的第一线观
2024年的RAG
万字长文梳理2024年的RAG (原创标题) 原创 InfiniFlow 2024年12月23日 10:40 上海 在已经过去的 2024 年,RAG 的发展可以称得上是风起云涌,我们回顾全年,从多个角度对全年的发展进行总结。 首先用下图镇楼:
RAG行业报告
第一部分:RAG 技术概述 1. RAG 基础 1.1 什么是 RAG(Retrieval-Augmented Generation) RAG(检索增强生成)是一种融合了信息检索和自然语言生成的新一代语言模型技术。其核心理念在于利用海量文本知识库增强语言模型的知识获取能力,从而能够根据给定的问题或上