Name	Name	Last commit message	Last commit date
Latest commit History 14 Commits
.github/workflows	.github/workflows
.idea	.idea
app	app
gradle/wrapper	gradle/wrapper
.gitignore	.gitignore
BUILD_GUIDE.md	BUILD_GUIDE.md
CONTRIBUTING.md	CONTRIBUTING.md
LICENSE	LICENSE
ProxyPin12-25_23_57_30.har..bin	ProxyPin12-25_23_57_30.har..bin
README.md	README.md
README_EN.md	README_EN.md
RELEASE.md	RELEASE.md
api.properties.example	api.properties.example
build.gradle.kts	build.gradle.kts
build.sh	build.sh
gradle.properties	gradle.properties
gradlew	gradlew
keystore.properties.example	keystore.properties.example
settings.gradle.kts	settings.gradle.kts
项目使用文档.md	项目使用文档.md

AI Boss - 智能 Android 自动化助手

License Android Kotlin CI

English | 中文文档

一款基于豆包 AI 的 Android 智能助手应用,支持离线语音识别和自然语言任务自动化。

下载 APK | 使用文档 | 贡献指南

📱 应用简介

AI Boss 是一款智能的 Android 自动化助手应用,通过自然语言描述任务,AI 会自动分析屏幕内容并执行相应操作。支持离线中文语音输入,让操作更加便捷。

✨ 核心特性

🎤 离线语音识别 - 集成 Vosk 引擎,支持中文语音转文字,无需联网
💬 聊天式交互 - 通过对话方式描述任务,AI 自动理解并执行
🤖 智能自动化 - AI 分析屏幕内容,自动执行点击、输入、滑动等操作
📝 聊天记录保存 - 自动保存对话历史,关闭应用后不丢失
🎯 任务完成通知 - 任务完成后弹窗提示,可复制结果
🔄 快捷重试 - 点击消息上的刷新按钮可快速重新执行任务
🎨 现代化 UI - Material Design 3 设计,流畅的动画效果

🚀 快速开始

系统要求

Android 8.0 (API 26) 或更高版本
约 50MB 可用存储空间(包含语音模型)

安装步骤

下载 APK
- 从 Releases 下载最新版本
- 或从源码构建:
```
./gradlew assembleDebug
./gradlew installDebug
```
授予权限
- 录音权限:首次使用语音输入时会请求
- 无障碍权限:进入系统设置 → 无障碍 → 启用 "AI Boss"
- 悬浮窗权限:Android 6.0+ 需要在设置中授权

配置 API 密钥(如果从源码构建)

cp api.properties.example api.properties
# 编辑 api.properties 填入你的豆包 AI API 密钥

使用方法

打开应用,点击底部输入框
输入或语音描述任务,例如:
- "打开淘宝搜索手机"
- "查看今天的天气"
- "在抖音点赞前5个视频"
点击发送,AI 会自动执行任务

语音输入

方式一:按住说话(推荐)

按住麦克风图标 🎤
开始说话
松开自动停止并填入文字

方式二:点击录音

点击麦克风图标开始录音
说话时实时显示识别结果
再次点击停止

💡 提示:首次启动会加载语音模型(约3-5秒),完成后会提示"语音识别已就绪"

🏗️ 技术架构

技术栈

开发语言: Kotlin
UI 框架: Jetpack Compose + Material Design 3
数据库: Room + SharedPreferences
网络: OkHttp + Gson
异步: Kotlin Coroutines + Flow
语音识别: Vosk (离线中文模型)
AI 引擎: 豆包 Context API
系统服务: Accessibility Service
最小 SDK: 26 (Android 8.0)
目标 SDK: 34 (Android 14)

核心模块

1. AI 客户端 (`ai/DoubaoApiClient.kt`)

封装豆包 Context API 调用
支持上下文对话管理
自动处理 API 认证和错误

2. 语音识别 (`voice/VoiceRecognizer.kt`)

Vosk 离线语音识别引擎
实时语音转文字
中文空格自动移除
按住说话/点击录音两种模式

3. 无障碍服务 (`service/MyAccessibilityService.kt`)

屏幕内容抓取和解析
元素查找和操作
支持点击、输入、手势操作

4. 任务管理器 (`automation/TaskManager.kt`)

AI 驱动的自动化执行引擎
智能决策系统
动作解析和执行
进度回调和状态管理

项目结构

AIAutomation/
├── .github/
│ └── workflows/
│ └── android-ci.yml # CI/CD 配置
├── app/
│ ├── src/
│ │ ├── main/
│ │ │ ├── java/com/aiautomation/
│ │ │ │ ├── ai/ # AI 客户端
│ │ │ │ ├── automation/ # 自动化引擎
│ │ │ │ ├── data/model/ # 数据模型
│ │ │ │ ├── service/ # 系统服务
│ │ │ │ ├── settings/ # 应用设置
│ │ │ │ ├── ui/ # UI 界面
│ │ │ │ └── voice/ # 语音识别
│ │ │ └── res/ # 资源文件
│ │ ├── test/ # 单元测试
│ │ └── androidTest/ # UI 测试
│ ├── build.gradle.kts
│ └── proguard-rules.pro
├── api.properties.example # API 配置模板
├── keystore.properties.example # 签名配置模板
├── .gitignore
├── README.md # 中文文档
├── README_EN.md # 英文文档
├── RELEASE.md # 发布指南
├── CONTRIBUTING.md # 贡献指南
├── LICENSE # MIT 许可证
└── 项目使用文档.md # 详细使用说明

🔧 开发指南

构建项目

# 清理项目
./gradlew clean
# 构建 Debug 版本
./gradlew assembleDebug
# 构建 Release 版本(需要配置签名)
./gradlew assembleRelease
# 运行测试
./gradlew test
# 安装到设备
./gradlew installDebug

主要依赖

Jetpack Compose - 现代化 UI 框架
Vosk - 离线语音识别
OkHttp - 网络请求
Room - 本地数据库
EasyFloat - 悬浮窗管理

完整依赖列表见 app/build.gradle.kts

语音模型

应用使用 vosk-model-small-cn-0.22 (42MB) 进行中文识别。如需更高准确率:

从 alphacephei.com/vosk/models 下载 vosk-model-cn-0.22.zip (255MB)
解压并重命名为 model-cn
替换 app/src/main/assets/model-cn
重新编译应用

📦 Release 构建

详见 RELEASE.md 了解如何:

生成签名密钥
配置签名
构建 Release APK
发布到 GitHub Releases

🤝 贡献

欢迎贡献代码!请查看贡献指南了解详情。

Fork 本仓库
创建特性分支 (git checkout -b feature/AmazingFeature)
提交更改 (git commit -m 'Add some AmazingFeature')
推送到分支 (git push origin feature/AmazingFeature)
提交 Pull Request

📄 许可证

本项目采用 MIT 许可证 - 详见 LICENSE 文件

❓ 常见问题

Q: 为什么首次启动较慢?
A: 需要从 assets 解压语音模型文件(42MB),仅首次运行时需要,后续启动会快很多。

Q: 语音识别准确率如何提高?
A: 保持安静环境、吐字清晰、语速适中、手机距离适当(20-30cm),或升级到大型模型。

Q: 无障碍服务为什么必须开启?
A: 应用需要通过无障碍服务来读取屏幕内容和执行自动化操作,这是 Android 系统对自动化应用的权限要求。

Q: 任务执行失败怎么办?
A: 检查无障碍权限是否开启、网络连接是否正常、尝试更清晰地描述任务、查看悬浮窗的 AI 推理过程。

🔗 相关资源

📊 项目状态

版本: 1.0.0
构建状态: CI
APK 大小: ~15 MB

🙏 致谢

感谢所有贡献者和以下开源项目:

Vosk - 离线语音识别
豆包 AI - AI 能力支持
EasyFloat - 悬浮窗管理
Jetpack Compose - 现代化 UI 框架

Made with ❤️ by the AI Boss team

⭐ 如果这个项目对你有帮助,请给个 Star

License

mz135135/ai-boss

Folders and files

Latest commit

History

Repository files navigation

AI Boss - 智能 Android 自动化助手

📱 应用简介

✨ 核心特性

🚀 快速开始

系统要求

安装步骤

使用方法

语音输入

🏗️ 技术架构

技术栈

核心模块

1. AI 客户端 (ai/DoubaoApiClient.kt)

2. 语音识别 (voice/VoiceRecognizer.kt)

3. 无障碍服务 (service/MyAccessibilityService.kt)

4. 任务管理器 (automation/TaskManager.kt)

项目结构

🔧 开发指南

构建项目

主要依赖

语音模型

📦 Release 构建

🤝 贡献

📄 许可证

❓ 常见问题

🔗 相关资源

📊 项目状态

🙏 致谢

About

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

1. AI 客户端 (`ai/DoubaoApiClient.kt`)

2. 语音识别 (`voice/VoiceRecognizer.kt`)

3. 无障碍服务 (`service/MyAccessibilityService.kt`)

4. 任务管理器 (`automation/TaskManager.kt`)

Packages