DeepSeek-R1 Categories | 飞行的蜗牛

飞行的蜗牛

Konck! Knock!

vuePress-theme-reco 极客学长 2013 - 2025

飞行的蜗牛

Choose mode

dark
auto
light

技术杂谈
Database
Docker
PHP
随笔杂谈
前端开发
FunnyTools
Jekyll
读书笔记
Java
SpringBoot
区块链技术
IPFS
C/C++
Filecoin
Golang
Sharding-JDBC
分布式存储
Lotus-源码系列
Lotus
框架源码系列
Spring-源码系列
AI
ChatGPT
Stable Diffusion
DeepSeek-R1
DeepSeek-V3

GeekAI (opens new window)

极客学长

154

文章

151

标签

技术杂谈
Database
Docker
PHP
随笔杂谈
前端开发
FunnyTools
Jekyll
读书笔记
Java
SpringBoot
区块链技术
IPFS
C/C++
Filecoin
Golang
Sharding-JDBC
分布式存储
Lotus-源码系列
Lotus
框架源码系列
Spring-源码系列
AI
ChatGPT
Stable Diffusion
DeepSeek-R1
DeepSeek-V3

GeekAI (opens new window)

DeepSeek-R1 Categories

Konck! Knock!

vuePress-theme-reco 极客学长 2013 - 2025

技术杂谈 21
Database 7
Docker 4
PHP 5
随笔杂谈 8
前端开发 7
FunnyTools 8
Jekyll 1
读书笔记 7
Java 9
SpringBoot 4
区块链技术 15
IPFS 5
C/C++ 1
Filecoin 32
Golang 2
Sharding-JDBC 3
分布式存储 11
Lotus-源码系列 8
Lotus 1
框架源码系列 1
Spring-源码系列 4
AI 8
ChatGPT 4
Stable Diffusion 2
DeepSeek-R1 1
DeepSeek-V3 1

DeepSeek R1 的核心技术解读，你不能不知道的 AI 干货

杨立昆

DeepSeek-R1 的横空出世，这不是一个简单的中国 AI 技术超过美国的问题，而是开源模型超越了专有模型，这是开源世界的胜利。

DeepSeek凭借其创新的技术和卓越的性能，迅速崭露头角，成为行业内备受瞩目的力量。DeepSeek的应用不仅在国内外各大社交媒体平台上取得了显著的用户增长，还在AI技术的多项评比中名列前茅，展现了其强大的市场竞争力。 DeepSeek R1模型引入了不依赖监督微调的强化学习技术，使得模型在微调后的性能大幅提升。例如，在数学能力方面，基础模型的得分为100分，而经过微调后，得分可达到450分。本文基于对DeepSeek-V3和R1论文的研究，解析 DeepSeek-R1 的训练过程以及其核心技术原理。

极客学长 2025-02-16 0 DeepSeek AI R1 推理模型 COT 思维链

上一页 1 ... 1 ... 1 下一页跳转至前往