通古大模型是由华南理工大学团队基于古籍领域长期积累的丰富大数据资源,通过自动生成的对话模板和大模型指令微调技术训练而成的数字人文模型。
通古大模型功能特点包括:
1、古籍理解和处理能力:
– 通古大模型具备强大的古籍理解和处理能力,能够智能实现文白翻译、句读标点和古籍检索等功能。
2、多阶段指令微调:
– 模型采用了多阶段指令微调技术,结合冗余度感知微调(RAT)方法,显著提升了下游任务性能,同时保留了基座模型的能力。
3、丰富的古籍数据资源:
– 通古大模型基于2.41B古籍语料进行无监督增量预训练,并在400万古籍对话数据上进行指令微调。
4、高效迁移学习:
– 通过渐进式微调,通古大模型能够在有限的数据下实现多个任务的高效迁移学习和专业化,从而提高全面的古籍处理任务熟练程度。
5、自然对话形式:
– 模型以自然对话的形式融合多种任务,使得用户能够以更亲切自然的方式了解中国传统文化。
6、古籍文档分析与识别系统:
– 通古大模型还配套开发了古籍文档分析与识别系统,能够自动定位并识别古籍图片中的文本,添加标点符号并翻译为白话文。
通古大模型应用场景:
1、古籍研究与教学:帮助研究人员和学生更高效地理解和翻译古籍文献。
2、文化传承与传播:通过自然对话形式,让大众更便捷地了解中华传统文化。
3、古籍数字化:为古籍文物数据挖掘、知识发现和智能化开发提供技术支撑。
通古大模型项目地址:
1、Github仓库:https://github.com/SCUT-DLVCLab/TongGu-LLM
2、HuggingFace模型库:https://huggingface.co/SCUT-DLVCLab/TongGu-7B-Instruct
一款群核科技开源的三维空间理解设计的大型语言模型—— SpatialLM
一款支持文本、图像、语音等多种模态的AI训练模型——序列猴子
一款90分钟内生成10万Token,相比传统方法提速3倍以上的AI框架——TokenSwift
LLM4AD:一个开源、简洁、模块化的基于大模型的自动算法设计平台
上面是“通古大模型:一款具备强大的古籍理解和处理能力的古籍大语言模型”的全面内容,想了解更多关于 IT知识 内容,请继续关注web建站教程。
当前网址:https://ipkd.cn/webs_17190.html
workflows工作流
一张由表情符号组成的照片ComfyUI工作流
骨骼般的恶魔修女ComfyUI工作流
一匹热血沸腾的汗血宝马庄严地站立着ComfyUI工作流
雪地里一只可爱的小老虎
广阔的沙漠中矗立着一个生锈的巨大头盔
一群邪恶的小黄人ComfyUI工作流
一只在星系中漂浮宇宙生物ComfyUI工作流
树上一个快乐的猕猴桃ComfyUI工作流
猜你喜欢
声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!