~/posts

55 essays · sorted by date desc

055 Agentic RAG 深度解析:从检索增强到智能体驱动的 RAG 架构演进 long-form 05/13 054 Draft-Thinking:让长思维链推理成本降低 40% 的新方法 paper 05/13 053 AI 代码编辑器横评 2026:Cursor vs Windsurf vs GitHub Copilot vs Claude Code tools 05/13 052 UI-TARS Desktop:ByteDance 开源桌面自动化 AI Agent 实战指南 workshop 05/13 051 LLM 推理引擎横评 2026:vLLM vs SGLang vs TensorRT-LLM 实测对比 tools 05/13 050 AI 代理框架 2026 全景对比:LangGraph vs CrewAI vs AutoGen vs Mastra vs DeerFlow long-form 05/12 049 2026年5月AI模型大战:GPT-5.5 vs Claude vs Gemini vs DeepSeek V4全景分析 long-form 05/12 048 AI 编码助手写的代码越多,维护成本越高?实战降低维护成本指南 workshop 05/12 047 AI 安全 2026:国际安全报告、对齐研究突破与安全最佳实践 workshop 05/12 046 AI 周报 002:Claude Code 限频翻倍、GPT-5.5 Instant、Qwen3.6 MoE 开源 weekly 05/12 045 Claude Code 限频翻倍:5 月新规下的实战优化策略 workshop 05/12 044 GitHub Trending AI工具周榜:2026年5月第2周 tools 05/12 043 Google I/O 2026 实战指南:Gemini API、Android 17 AI 功能与 Aluminium OS 开发者机会 workshop 05/12 042 GPT-5.5-Cyber 安全能力深度实战:漏洞分析、威胁情报与代码审计 workshop 05/12 041 异构 Agent 企业化组织:OneManCompany 框架如何用公司架构管理 AI 团队 long-form 05/12 040 Claude Computer Use 构建 RPA:实战可行但成本是传统方案的 45 倍 workshop 05/12 039 KV Cache 压缩技术全景:从 GQA 到量化到 PagedAttention 的工程进化 paper 05/12 038 2026 本地 AI 研究工具横评:Ollama、LM Studio、vLLM 等 7 款工具实测对比 tools 05/12 037 本地 LLM 部署工具 2026 实测:Ollama vs LM Studio vs vLLM vs llama.cpp tools 05/12 036 MARBLE:扩散模型强化学习中的多维奖励平衡新范式 paper 05/12 035 MCP企业采用率78%背后:技术演进、安全挑战与最佳实践 workshop 05/12 034 MCP安全实战:从CVE-2026-26030看AI Agent安全边界 workshop 05/12 033 MCTS-Driven Knowledge Retrieval for LLMs:用蒙特卡洛树搜索增强大模型推理 paper 05/12 032 端侧 AI 的崛起:当 Chrome 静默安装 4GB 模型,On-Device LLM 意味着什么 long-form 05/12 031 Prompt Caching 实战:一行配置让 Claude/GPT API 成本降低 90% workshop 05/12 030 Qwen3.6-35B-A3B 评测:3B 激活参数如何打赢 22B Dense 模型 tools 05/12 029 Skill1 论文精读:用 RL 统一训练 Agent 的技能选择、利用与蒸馏 paper 05/12 028 SOM论文速读:LLM Agent如何建模对手行为? paper 05/12 027 投机解码从理论到生产:Speculative Decoding 全链路优化指南 long-form 05/12 026 向量数据库 2026 选型:Milvus vs Qdrant vs Weaviate vs PgVector 终极对比 tools 05/12 025 AI Agent 正在吃掉 SaaS:从工具到平台的架构革命 long-form 05/11 024 Browser Use 实战:让 AI Agent 操控浏览器完成自动化任务 workshop 05/11 023 Continuous Latent Diffusion Language Model:当扩散模型学会写文字 paper 05/11 022 DeepSeek V4 深度测评:开源模型如何重新定义 LLM 性价比 tools 05/11 021 Dify 实战:用开源 LLMOps 平台 30 分钟搭建企业级 AI 应用 workshop 05/11 020 AI Agent Memory 架构全解:从 Buffer 到 Persistent Memory 的工程实践 long-form 05/10 019 Attention Sink 深度解析:StreamingLLM 如何让大模型突破上下文窗口 paper 05/10 018 Devin vs OpenHands vs SWE-agent:2026 自主编程 Agent 终极横评 tools 05/10 017 LangGraph 实战:用状态机思维构建生产级多 Agent 工作流 workshop 05/10 016 Gemma 4 深度解析:Google 开源模型的逆袭之路 paper 05/10 015 LLM 微调 2026:从 LoRA 到 QLoRA 到 DoRA 的技术演进与选型指南 long-form 05/10 014 Structured Output 实战:用 JSON Schema 构建可靠的 LLM 数据提取管线 workshop 05/10 013 Ollama 实战:本地部署 LLM 的完整指南——从安装到生产级 API 集成 workshop 05/10 012 Vibe Coding 2026:当「描述想法」取代「写代码」 tools 05/10 011 Agentic AI 第二年:从 PoC 到生产系统的五个认知跃迁 long-form 05/09 010 AI Agent 安全红线:当 Agent 开始违规,我们怎么设计信任边界 long-form 05/09 009 AI 周报 #001: Claude Opus 4.7 发布 · OpenAI Frontier 计划 · Agentic AI 全面铺开 weekly 05/09 008 Claude Code vs Cursor vs Windsurf: 2026 AI 编程助手终极横评 tools 05/09 007 Claude Opus 4.6 vs GPT-5.4 vs Gemini 3.1 Pro: 2026 春季 LLM 实测横评 paper 05/09 006 MCP 实战:从零搭建一个 Model Context Protocol Server workshop 05/09 005 LLM 推理优化全景 2026:从 10x 降本到实时响应的工程路径 long-form 05/09 004 多模态 AI 实战:用 Claude 4.7 和 Gemini 3 搭建图文理解 Pipeline workshop 05/09 003 RAG 架构选型 2026: Pipeline vs Agentic vs Knowledge Graph — 怎么选不翻车 workshop 05/09 002 State Space Models 深度解析:Mamba 凭什么挑战 Transformer paper 05/09 001 Hello, World — 一个面向 AI 前沿的工程笔记 long-form 05/09