Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

lhf860/AI_Tutorial_Example

Folders and files

NameName
Last commit message
Last commit date

Latest commit

History

23 Commits

Repository files navigation

AI_Tutorial_Example

记录AI算法的实践过程,包括但不限于NLP、推荐、音频、图像、推荐、LLM和多模态等 (谨以此记录学习过程:主要借助一些开源的数据集进行实战操作)

工具

  • torch
  • deepspeed
  • transfomers
  • modelscope
  • peft
  • ms-swift

一、LLM部分

1.1 LLM 微调(sft)

采用法律问答数据中的答案部分进行领域预训练
  • IA3
  • LoRA
  • p-tuning
  • prefix_tuning
  • primpt_tuning
  • generattion_chat
  • summarization
  • ner
  • accelerate
  • huggingface trainer

LLM结构化输出的用途

  • LLM答案生成(摒弃无关生成)
  • RAG答案生成、置信度、相关性等
  • 信息抽取:实体识别、关系抽取
  • 多项选择等
  • 文本分类
  • ...

结构化输出工具

实战结构化输出

三、RAG

模型及工具

  • elasticsearch 8.15
  • langchain
  • langgraph
  • vllm
  • qwen
  • xinference
  • bge

RAG流程

  • 数据索引index

    • 数据集进行分块
    • 通过产生Embedding
    • 导入到ES中
  • 召回

    • Embedding召回
    • BM25召回
  • 答案生成

    • 评估相关性,并通过Qwen生成答案。
    • 通过VLLM获取结构化输出
  • RAG评估

    • 评估框架ragas
  • Query Decomposition(问题分解)

    主要是借助了Qwen 和书生浦语Internlm大语言模型,结合目前流程的思维链(COT)、Planning(整体规划、迭代规划等能力)、PlanRAG、AutoRAG等来完成子问题的分解

    子问题分解

四、Agent

About

记录AI算法的实践过程,包括但不限于NLP、推荐、音频、图像、推荐、LLM和多模态等

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

Contributors

AltStyle によって変換されたページ (->オリジナル) /