在设计 Unit Mesh 架构时,其思想是以 Unit(如代码单元)作为 AI 辅助生成的元素,以辅助人类解决复杂的软件开发问题。
几年前,在初步设计了 Datum Lang 的语法后,我开始探索在 IDE 中支持编程语言,于是写了那篇《编程语言的 IDE 支持》。在生成式 AI 的影响下,我开发、维护的几个开源编程语言相关的工具,又在持续发生变化:
去年年初,我们开源 AutoDev 的初衷是:
UnitGen 是我们从 UnitEval 拆分出来的代码数据集开源解决方案,UnitGen 旨在结合开源模型为 AutoDev 插件提供更好的私有化部署方案。
太长不读性:
在 2022 年总结里,因为 COVID-19 带来了一系列太多变化。而在 2023 年,生成式 AI 的突然出现也带来了更多的变化。
2023 年,生成式 AI 的火爆,让越来越多的组织开始引入 AI 辅助编码。与在 2021 年发布的 GitHub Copilot 稍有差异的是,代码补全只是重多场景中的一个。 大量的企业内部在探索结合需求生成完整代码、代码审查等场景,也引入生成式 AI,来提升开发效率。
在这个背景下,我们(Thoughtworks)也开发了一系列的开源工具,以帮助更多的组织构建自己的 AI 辅助编码助手 。
最近,我们在围绕 AutoDev 开源插件,构建完整的端到端开源辅助编程方案。即:
回顾 2023 年,可以明显地看到生成式 AI 带给软件工程带来的新思考,每个组织也在探索结合生成式 AI 的可能性。 Unit Mesh (https://github.com/unit-mesh) GitHub 组织正是基于我与我的同事的研究,所构建的一系列围绕于生成式 AI 应用于软件研发的开源项目。
Unit Eval 是一个针对于构建高质量代码微调的开源工具箱。其三个核心设计原则: