使用自己的大模型 api 在表格中生成
引言
多维表格大家都听说过吧?比起传统的在线表格这玩意有这样几个优势:
- 本质上是一个在线数据库,所以数据很多很多的时候也不卡
- 可以切换多种视图
- 支持有限的自动化
对于大众来说,其实不会太在意背后的技术和用不到的功能,所以可能很多人没有实际体验过,甚至对这玩意需要先规定列的属性相当不适应。自动化功能和精细权限管理太难,多视图模式和数据展示用不上,所以何必折腾呢?我的意见是:他真的有 ai 加成…
其实表格天然就很适合做生成,比起平常文档形式的”上下”视图,表格的”左右”视图可以直观的看到输入的信息和输出的信息。而序号、标题确保了可以快速定位。
目前有 ai 加成的多维表格首先是飞书和钉钉,还有 Vika 和 Airtable 等等,我平常就用的钉钉,但是他有个问题:他是免费的。免费当然很好,但是当你薅了大几千次 qwen 之后,他会不断的给你显示”等待中”。那么,花钱行不行呢?问题来了,他是免费的…想花钱也没地方花…
因此,对我来说,重新整一个本地版的 ai 表格就情有可原了,反正技术原理也不复杂。
本项目用来解决下面几个痛点:
- 在线表格无法选择 api 供应商
- 在线表格可能会触发大型批量使用限制
使用方式
首先需要完成配置,在.config
文件里面输入自己的模型 api 和密钥,然后把需要启用的 api 的 ENABLED 改成 true.
第二,更新 systemprompt.txt
以设置所需的系统提示。
第三,在没有prompts.xlsx
文件的情况下运行python main
, 如果包齐全的话会自动生成一个表格,里面含有使用指南和需要填写的信息。
第一列是自动生成的,包含了获取到的系统提示词文件和调用到的 api 模型名称。
第二列是需要填写的用户提示词,写入后将依次调用 api 回答。
第三列是是否需要生成,主要用于对结果不满意需要重新生成的情况,通过填入合适的数字决定是否调用 api 进行生成或重复生成。
第四列是生成结果。
最后,在有prompts.xlsx
存在的情况下,会读取存在的文件对相应的信息进行处理。
结论
总之,给自己造了个轮子,该说不说其实原来我也喜欢用 json 之类的,但是跟公司打交道多了发现关系型数据库用得多,然后二维表格妙不可言…
如果可以结合 teable 之类的数据库型表格就更完美了,但是使用上的复杂度会再高一层,我觉得不好…