论文索引
📚 滚动更新。每篇论文最终会有一个独立解读页(在专题里),这里只做导航与状态跟踪。
DeepSeek 系列
Section titled “DeepSeek 系列”| 时间 | 论文 | 状态 | 相关页面 |
|---|---|---|---|
| 2026 | DeepSeek-V4: Towards Highly Efficient Million-Token Context Intelligence | ✅ 已解读 | V4 研究 · 混合注意力 |
| 2025 | DeepSeek-VL series | ✅ 已解读 | 视觉原语 |
| 2024 | DeepSeek-V3 Technical Report | 🚧 计划中 | — |
| 2024 | DeepSeek-R1: Incentivizing Reasoning Capability via RL | 🚧 计划中 | — |
| 2024 | DeepSeek-V2: A Strong, Economical, and Efficient MoE | 🚧 计划中 | — |
长上下文相关
Section titled “长上下文相关”| 时间 | 论文 | 状态 |
|---|---|---|
| 2024 | RoPE Scaling / NTK-aware | 📌 已提名 |
| 2024 | Ring Attention | 📌 已提名 |
| 2025 | Native Sparse Attention | 📌 已提名 |
推理 / Test-Time Scaling
Section titled “推理 / Test-Time Scaling”| 时间 | 论文 | 状态 |
|---|---|---|
| 2024 | OpenAI o1 system card | 📌 已提名 |
| 2025 | s1: Simple test-time scaling | 📌 已提名 |
状态图例:✅ 已解读 · 🚧 计划中 · 📌 已提名
想加论文?请在 GitHub Discussions 用 “提名” 模板提交。