通古大模型是由华南理工大学团队基于古籍领域长期积累的丰富大数据资源,通过自动生成的对话模板和大模型指令微调技术训练而成的数字人文模型。
通古大模型功能特点包括:
1、古籍理解和处理能力:
– 通古大模型具备强大的古籍理解和处理能力,能够智能实现文白翻译、句读标点和古籍检索等功能。
2、多阶段指令微调:
– 模型采用了多阶段指令微调技术,结合冗余度感知微调(RAT)方法,显著提升了下游任务性能,同时保留了基座模型的能力。
3、丰富的古籍数据资源:
– 通古大模型基于2.41B古籍语料进行无监督增量预训练,并在400万古籍对话数据上进行指令微调。
4、高效迁移学习:
– 通过渐进式微调,通古大模型能够在有限的数据下实现多个任务的高效迁移学习和专业化,从而提高全面的古籍处理任务熟练程度。
5、自然对话形式:
– 模型以自然对话的形式融合多种任务,使得用户能够以更亲切自然的方式了解中国传统文化。
6、古籍文档分析与识别系统:
– 通古大模型还配套开发了古籍文档分析与识别系统,能够自动定位并识别古籍图片中的文本,添加标点符号并翻译为白话文。
通古大模型应用场景:
1、古籍研究与教学:帮助研究人员和学生更高效地理解和翻译古籍文献。
2、文化传承与传播:通过自然对话形式,让大众更便捷地了解中华传统文化。
3、古籍数字化:为古籍文物数据挖掘、知识发现和智能化开发提供技术支撑。
通古大模型项目地址:
1、Github仓库:https://github.com/SCUT-DLVCLab/TongGu-LLM
2、HuggingFace模型库:https://huggingface.co/SCUT-DLVCLab/TongGu-7B-Instruct
Doubao-1.5-pro:一款由豆包团队开发的高性能稀疏 MoE大语言模型
人大高瓴AI联合蚂蚁推出LLaDA,打破大语言模型“逆诅咒”
Qihoo-T2X:一款由360CVGroup开发的高效扩散变换器模型
Long-VITA:是由腾讯优图等实验室提出的一种大型多模态模型
上面是“通古大模型:一款具备强大的古籍理解和处理能力的古籍大语言模型”的全面内容,想了解更多关于 IT知识 内容,请继续关注web建站教程。
当前网址:https://ipkd.cn/webs_17190.html
workflows工作流
一只可爱的雪豹在雪地里散步ComfyUI工作流
树上挂着一只表情可爱的香蕉ComfyUI工作流二
一辆机器人虎狮高端混合动力车ComfyUI工作流
在森林中心有一座蛇形的房子ComfyUI工作流
一张严重受损的宇宙飞船的照片ComfyUI工作流
一碗热气腾腾的拉面ComfyUI工作流
图片转视频ComfyUI工作流
一只张大嘴巴露出锋利的牙齿正在咆哮的雪豹
猜你喜欢
声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!