台积电的IT Day 2025活动虽然看似技术研讨会,实则更像一场大型招募会。但吸引我关注的焦点是:超过六成的议程都围绕AI展开。这让我意识到,台积电在大模型、AI Agent 以及晶圆制造等领域的AI应用已经走在了行业前沿,并且正以惊人的速度迭代其技术能力。本文将深入探讨台积电在AI领域的战略布局、技术实践以及未来发展方向,尤其是在大模型、AI Agent以及晶圆制造流程中的应用。
AI战略与技术选型:自主可控与快速迭代
早在九年前,我就听说台积电内部有一个团队在进行机器学习相关的研究,最初以为主要集中在晶圆生产的良率提升方面。然而,这次IT Day展现出的远不止于此。台积电在运用AI技术之前,已经制定了一套完善的规范政策,确保所有软硬件技术的选择都符合企业自身的PIP(Proprietary Information Protection)政策。这体现了台积电对于数据安全和知识产权的高度重视,也为他们在相对保守和封闭的环境中大胆探索AI应用奠定了基础。
值得注意的是,台积电的技术迭代速度非常快。他们不仅与Open AI合作,使用ChatGPT模型并进行内部微调,还积极拥抱开源模型,如Llama和Qwen。这表明台积电在技术选型上兼顾了成熟的商业方案和开源社区的活力,能够根据自身需求灵活调整。而每年30%的GPU算力增长速度,则直接反映了台积电在AI基础设施上的巨额投入和加速布局。这种自主可控与快速迭代并行的战略,确保了台积电在AI浪潮中能够保持领先地位。
大模型应用:从ChatGPT到企业级AI平台
台积电对大模型的应用,并非简单地引入通用模型,而是深入到企业内部的各个环节。从与Open AI合作微调ChatGPT,到使用Llama和Qwen等开源模型,台积电不断探索最适合自身业务场景的大模型解决方案。他们将大模型作为底层推理引擎,结合各种定制化的AI Agent,构建了一个内部的大平台,服务于不同的部门和角色,包括工厂产线、行政人员、软件开发人员和数据科学家等。
例如,台积电利用大模型进行内部知识库的构建和管理。通过将大量的不同类型文件转换成Gen AI更容易识别的Markdown格式,并结合OCR技术,台积电成功地让AI能够理解和利用海量的内部文档资料。这意味着,即使资深员工离职,他们的经验和知识也能被保存在知识库中,并由AI赋能给新的员工,加速问题解决和知识传承,形成一个持续滚动的知识飞轮。这种模式极大地提高了企业内部的知识共享和创新效率。
AI Agent:需求驱动的智能化解决方案
台积电在AI Agent方面的应用也十分深入。他们并没有盲目追随流行的AI功能,而是坚持“Job-To-Be-Done”(JTBD)的理念,专注于设计真正能够帮助用户完成所需工作的智能化解决方案。他们将多个AI Agent串联或并行调用,解决不同类型的问题。例如,一个典型的串联Agent流程可能是:用户提出需求->Agent1进行需求规划->Agent2进行设计->Agent3进行开发->Agent4进行测试->Agent5进行维护。而一个并行Agent流程可能是:Agent1收集数据->Agent2进行数据分析->Agent3生成报告,最终汇总结果。
台积电希望将整个流程,从需求规划、设计、开发到测试和维护,全部使用AI进行赋能。不同的问题类型可以呼叫专门的AI Agent来解决,甚至多个大模型之间可以进行互动。这种高度定制化的AI Agent体系,能够更好地满足不同部门和角色的特定需求,提高工作效率和智能化水平。
晶圆制造与AI:良率提升与物理定律的融合
台积电作为全球领先的晶圆制造商,在晶圆制造过程中也大量应用了AI技术,尤其是在良率提升和电路设计方面。
良率提升: 台积电使用大量的影像数据构建视觉模型,希望能够提早发现机台问题,提升晶圆良率。然而,在模型训练过程中,他们遇到了数据不足的挑战。尽管台积电每天会产生海量的生产数据,但真正拥有缺陷的晶圆数据却相对稀缺。为了解决这个问题,台积电采用了与我之前分享过的经验类似的方法:人造数据。他们通过AI生成假的缺陷数据,依据类似的模式产生相似的数据,从而弥补了训练数据的不足。这种数据增强技术对于解决数据稀缺问题至关重要。
电路设计: 台积电还在使用生成式AI来自动layout电路图。尽管他们是晶圆制造商,但也会为客户提供一些元件,并根据客户提交的电路图,依工艺制程给出设计建议。这些建议就应用了AI来预测较好的电路设计。这不仅可以帮助客户优化电路设计,提高芯片性能,也能够提升台积电的服务水平和竞争力。
物理定律融合: 要往更顶尖的制程发展,就需要优秀的物理学家。因此,台积电也自己训练了在物理能力方面的模型,确保AI生成的预测结果符合物理定律,避免出现模型幻觉。例如,在电磁学相关领域,台积电利用AI来模拟和优化电路的电磁特性,提高芯片的信号完整性和电磁兼容性。
边缘计算与SLM:满足全球工厂的实时推理需求
台积电的工厂遍布全球,包括中国台湾、日本、美国和德国等地。这种全球化的运营模式对AI模型的部署和推理提出了更高的要求。为了满足各地工厂对快速模型推理的需求,台积电采用了边缘计算和SLM(Small Language Model)相结合的方案。
他们首先在总部的私有云机房中训练大模型,然后将一些特定场景模式训练成特别的SLM,部署到各地的工厂进行边缘计算。这种方式既可以提高模型预测效率,减少数据传输延迟,又可以将机密数据保留在总部,确保数据安全。相比于LLM,SLM的建设成本也更低,更适合大规模的边缘部署。这种策略充分体现了台积电在AI应用上的务实和高效。
RAG:打造企业级知识检索系统
在AI学习和获取资料方面,台积电最早使用的是RAG(Retrieval-Augmented Generation)。但他们并没有简单地将文件上传到某个地方就让模型自己去使用,而是对数据进行了精细的处理。如前文所述,台积电将大量的不同类型文件都转换成markdown格式,使得Gen AI更容易识别。
台积电深刻理解JTBD原则,根据用户对不同信息的需求选择合适的AI功能。如果用户需要的是偏向搜索,他们可能只需要一个智慧的资料检索系统,而不一定需要复杂的RAG功能;如果用户需要的是信息摘要,那么就很适合RAG的应用场景;如果用户需要的是深度搜索,那么整个系统的设计就会完全不同。台积电的RAG应用,也充分考虑了数据安全和合规性,确保所有的数据访问都符合企业的PIP政策。
总结与展望:AI赋能下的未来晶圆制造
通过台积电IT Day 2025,我们看到了一个积极拥抱AI、快速迭代技术、并将其深入应用到企业各个环节的领先企业。从大模型到AI Agent,从良率提升到电路设计,台积电正以AI赋能其核心业务,并不断探索新的增长点。
台积电在AI方面的投入和布局,不仅能够提升其自身的竞争力,也将对整个半导体行业产生深远的影响。随着AI技术的不断发展和成熟,我们有理由相信,未来的晶圆制造将更加智能化、高效化和自动化,而台积电将继续引领这场变革。台积电在大模型、AI Agent和晶圆制造领域的深入探索和实践,为其他企业提供了宝贵的经验和借鉴,也为我们描绘了一个充满希望的AI赋能的未来。