Pinned【LLM 專欄】GPT-OSS 的神秘配方 part2: MXFP4把 tier 1 model 放到單卡 GPU,GPT-OSS 大幅降低 GPU 硬體需求的秘密:Microscaling & QuantizationSep 5Sep 5
Pinned【LLM 專欄】進階 context engineering:KV cache centric LLM 應用設計如何藉由 prompt design 來優化系統效能、降低成本並提升用戶體驗Aug 4Aug 4
【LLM 專欄】GPT-OSS 的神秘配方 part1: extreme small sliding window過度解讀 gpt-oss 尋找 openai 技術路線系列 part1: sliding window = 128 是什麼鬼 XDAug 11A response icon1Aug 11A response icon1
【Human-Agent-Computer interaction Design-2】如何正確設計 tools 來提升 Agent performanceCoding agent tools 設計實例: edit toolsJun 4Jun 4
【LLM 專欄】Deepseek v3 的訓練時間到底合不合理?淺談 LLM Training efficiency判斷 2025 年企業到底要不要跟風投入打造各自的 deepseek v3Jan 31Jan 31