Name	Name	Last commit message	Last commit date
Latest commit History 23 Commits
agent	agent
cv	cv
llm	llm
rag	rag
.DS_Store	.DS_Store
.gitignore	.gitignore
README.md	README.md

Name

Last commit message

Last commit date

Latest commit

History

23 Commits

agent

llm

rag

.DS_Store

.gitignore

README.md

AI_Tutorial_Example

记录AI算法的实践过程,包括但不限于NLP、推荐、音频、图像、推荐、LLM和多模态等 (谨以此记录学习过程:主要借助一些开源的数据集进行实战操作)

工具

torch
deepspeed
transfomers
modelscope
peft
ms-swift

一、LLM部分

1.1 LLM 微调(sft)

information extraction (信息抽取)
- 金融事件及主体抽取
- 命名实体识别
- 文本摘要
- 雅意信息抽取
领域多轮对话微调(multi_turn_conversations)
- 心理咨询多轮对话微调
文本纠错(text correct)
- csc文本纠错

1.2 LLM预训练(pretrained)

采用法律问答数据中的答案部分进行领域预训练

1.3 PEFT微调

IA3
LoRA
p-tuning
prefix_tuning
primpt_tuning

1.4 nlp_task

generattion_chat
summarization
ner

1.5 分布式训练

accelerate
huggingface trainer

1.6 LLM部署

1.7 LLM结构化输出

LLM结构化输出的用途

LLM答案生成(摒弃无关生成)
RAG答案生成、置信度、相关性等
信息抽取:实体识别、关系抽取
多项选择等
文本分类
...

结构化输出工具

实战结构化输出

二、CV(+ 多模态)

2.1 车牌识别微调

2.2 发票OCR识别

2.3 目标检测及OCR

三、RAG

模型及工具

elasticsearch 8.15
langchain
langgraph
vllm
qwen
xinference
bge

RAG流程

数据索引index
- 数据集进行分块
- 通过产生Embedding
- 导入到ES中
召回
- Embedding召回
- BM25召回
答案生成
- 评估相关性,并通过Qwen生成答案。
- 通过VLLM获取结构化输出
RAG评估
- 评估框架ragas
Query Decomposition(问题分解)

主要是借助了Qwen 和书生浦语Internlm大语言模型,结合目前流程的思维链(COT)、Planning(整体规划、迭代规划等能力)、PlanRAG、AutoRAG等来完成子问题的分解

子问题分解

四、Agent

# 4.1 agent实战-langgraph

# 4.2 crewai_agent

About

记录AI算法的实践过程,包括但不限于NLP、推荐、音频、图像、推荐、LLM和多模态等

Resources

Stars

Watchers

Forks

Folders and files

Latest commit

History

Repository files navigation

AI_Tutorial_Example

工具

一、LLM部分

1.1 LLM 微调(sft)

1.2 LLM预训练(pretrained)

1.3 PEFT微调

1.4 nlp_task

1.5 分布式训练

1.6 LLM部署

1.7 LLM结构化输出

LLM结构化输出的用途

结构化输出工具

实战结构化输出

二、CV(+ 多模态)

2.1 车牌识别微调

2.2 发票OCR识别

2.3 目标检测及OCR

三、RAG

模型及工具

RAG流程

四、Agent

# 4.1 agent实战-langgraph

# 4.2 crewai_agent

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages