【LLM 專欄】Deepseek v3 的訓練時間到底合不合理?淺談 LLM Training efficiency判斷 2025 年企業到底要不要跟風投入打造各自的 deepseek v3Jan 31Jan 31
【Human-Agent-Computer interaction Design】探索打造 LLM agentic system 的各種可能性Part1: The art of Tool design 如何讓 LLM agent 正確使用我們的工具?)Dec 29, 2024Dec 29, 2024
【0410 LLM新知】Mixture of Expert,2024年LLM的新標竿MoE正在悄悄崛起,淺談JetMoE, Jamba, DSMoE與Qwen1.5 MoEApr 10, 20241Apr 10, 20241
【專欄】ckip-llama-2真的有這麼爛嗎?淺談LLMs的training與data的關係。雙十連假FB上討論熱度最高的一個議題就是中研院推出的ckip-llama-2在各種政治、國家相關問題上的大翻車,問他自己屬於哪個國家會回中國,問國慶日會回10/1 … 等(ckip-llama-2已於連假下架,我們可以期待中研院做出一版更好的LLMs)。Oct 9, 20233Oct 9, 20233
【LLM週報0715~0721】LLama2開源商業可用、ChatGPT退步被證實、MetaAI研究者與眾研究者發表LLM的發展與挑戰因為LLM發展實在太快,等到有整理思考脈絡再發文章會太慢,所以改成以週報的形式來分享一些我認為每週重要的LLM新資訊,每週也不求多,3~5個要點就好。Jul 21, 2023Jul 21, 2023