Name	Name	Last commit message	Last commit date
Latest commit History 22 Commits
GPTChatLib	GPTChatLib
asr_arduino_demo	asr_arduino_demo
calorie_calculator_camera	calorie_calculator_camera
dazhi_v1	dazhi_v1
dazhi_v2	dazhi_v2
flash_access_manager	flash_access_manager
image_recognition_demo	image_recognition_demo
img	img
merged_camera_gpt	merged_camera_gpt
roo_setting	roo_setting
round_display_take_picture_fix	round_display_take_picture_fix
.gitattributes	.gitattributes
ESP32-audioI2S-master.zip	ESP32-audioI2S-master.zip
README.md	README.md
README_EN.md	README_EN.md
ReadmeForAgent.md	ReadmeForAgent.md
chatv.py	chatv.py
debug_chatv.py	debug_chatv.py

🤖 大智AI (Dazhi-AI)

Arduino License Platform

无服务端 AI 语音助手 | ESP32 平台 | 纯 Arduino 开发

English | 简体中文

📝 项目简介

大智AI是一个完全基于ESP32开发的无服务器AI语音助手,采用纯Arduino开发环境。它允许您直接在ESP32设备上运行AI语音交互,无需额外的服务器支持。现已支持多模态能力,可实现语音和视觉的AI交互。

🚀 主要特点

✅ 无服务端:

更灵活的二次开发机会
更高的自由度(可自定义修改prompt或模型)
更简单的部署流程(无需运行额外服务器)

✅ 两种语音识别方案:

Whisper模型识别 (高准确率)
科大讯飞实时ASR (低延迟)

✅ 完整语音交互:

语音输入
AI处理
语音输出

✅ 多模态能力:

图像识别
视觉分析
场景理解

🔧 系统架构

系统采用模块化设计,主要分为以下几个功能模块:

语音输入 (Speech-to-Text)
视觉输入 (Camera)
AI处理 (ChatGPT)
语音输出 (Text-to-Speech)

💻 代码说明

GPTChatLib库

核心库文件,需要拷贝到Arduino的libraries文件夹中。

功能	描述
ChatGPT通信	与OpenAI API进行通信,处理请求和响应
TTS	文本转语音功能,将AI回复转为语音
STT	语音转文本功能,将用户输入转为文本
图像识别	发送图像到GPT进行分析和识别
音频处理	处理和转换各种音频数据格式

实现版本对比

特性	V1版本 (dazhi_v1)	V2版本 (dazhi_v2)
语音识别引擎	OpenAI Whisper	科大讯飞实时ASR
识别模式	录音完成后整段发送	实时边说边识别
优势	API价格低	响应速度快,延迟更低

代码结构

├── dazhi_v1/ # Whisper实现版本
│ └── dazhi_v1.ino # 主程序
├── dazhi_v2/ # 讯飞ASR实现版本
│ └── dazhi_v2.ino # 主程序
├── merged_camera_gpt/ # 摄像头视觉识别示例
│ └── merged_camera_gpt.ino # 主程序
├── calorie_calculator_camera/ # 卡路里计算器示例
│ └── calorie_calculator_camera.ino # 主程序
├── image_recognition_demo/ # 图像识别演示
│ └── image_recognition_demo.ino # 主程序
└── GPTChatLib/ # 核心功能库
 ├── ArduinoGPTChat.cpp
 └── ArduinoGPTChat.h

🔌 硬件需求

引脚连接

功能	引脚
I2S_DOUT	3
I2S_BCLK	2
I2S_LRC	1
MIC_DATA	42
MIC_CLOCK	41
TOUCH_INT	D7

🚀 快速开始

环境准备
- 安装 Arduino IDE
- 安装 ESP32 开发板支持
- 安装必要的库:ArduinoJson, WiFi等
库文件安装
- 将GPTChatLib文件夹复制到Arduino的libraries目录
- 安装必要的库:
  - ArduinoWebsoket (v0.5.4)
  - ESP32-audioI2S-master (v3.0.13)
    - 注意:需要修改ESP32-audioI2S-master库文件:
    - 打开 ./ESP32-audioI2S-master/src/Audio.cpp
    - 查找:char host[] = "api.openai.com"
    - 将其修改为:char host[] = "api.chatanywhere.tech"
  - TFT_eSPI(用于显示屏支持)
  - SPIFFS(用于文件系统支持)
配置API密钥
- 在代码中填入您的OpenAI API密钥
- 如使用V2版本,需填入科大讯飞的API密钥
编译上传
- 选择合适的ESP32开发板
- 编译并上传代码到设备
测试使用
- 打开串口监视器
- 按提示进行语音或视觉交互

📚 示例项目

摄像头视觉识别 (merged_camera_gpt)

这个示例展示了如何使用ESP32S3 Sense的摄像头拍照,并将图像发送给GPT进行分析识别。

触摸屏幕拍照
自动将照片发送给GPT进行分析
通过串口显示识别结果

卡路里计算器 (calorie_calculator_camera)

这个示例实现了一个基于视觉识别的食物卡路里计算器。

拍摄食物照片
自动识别食物类型
估算食物重量和卡路里含量
在屏幕上显示分析结果

图像识别演示 (image_recognition_demo)

简单的图像识别演示,用于测试GPTChatLib的图像识别功能。

从SPIFFS读取图像
发送给GPT进行分析
显示识别结果

💬 交流讨论

欢迎加入我们的微信交流群,分享您的开发经验和问题:

微信群

开源协作,共同进步!
如果您觉得这个项目有帮助,请给它一个⭐️

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

zenhall/dazhi-ai

Folders and files

Latest commit

History

Repository files navigation

🤖 大智AI (Dazhi-AI)

✨ 目录

📝 项目简介

🚀 主要特点

🔧 系统架构

💻 代码说明

GPTChatLib库

实现版本对比

代码结构

🔌 硬件需求

推荐硬件

引脚连接

🚀 快速开始

📚 示例项目

摄像头视觉识别 (merged_camera_gpt)

卡路里计算器 (calorie_calculator_camera)

图像识别演示 (image_recognition_demo)

💬 交流讨论

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🤖 大智AI (Dazhi-AI)

✨ 目录

📝 项目简介

🚀 主要特点

🔧 系统架构

💻 代码说明

GPTChatLib库

实现版本对比

代码结构

🔌 硬件需求

推荐硬件

引脚连接

🚀 快速开始

📚 示例项目

摄像头视觉识别 (merged_camera_gpt)

卡路里计算器 (calorie_calculator_camera)

图像识别演示 (image_recognition_demo)

💬 交流讨论

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages