Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

cstdr/ChatGPTAssistant

Repository files navigation

ChatGPT助手

项目背景

一个基于 OpenAI API 的Android 语音助手,模型为"gpt-3.5-turbo"。

因为当时没有带语音功能的AI助手,并且需要科技,所以就自己做了一个。

2023年8月21日更新:

  • 反向代理服务器经常失败,换回OpenAI直连,需要配合科技使用。
  • 后面考虑使用中间件调用其他模型。

功能

  1. 基于 ChatGPT 3.5 的聊天功能,温度设置为 0.5 ,其他默认设置,没有初始角色设定。
  2. 可以语音输入,使用讯飞语音。默认GPT语音播报回答。语音播报可以停止。
  3. 支持上下文理解,可以多轮对话,比如扮演面试官角色进行面试沟通。
  4. 不需要科技可以直接使用。(7月失效)

使用

以下使用到的API均可免费申请:

  1. 申请 OpenAI API key:https://platform.openai.com/account/api-keys
  2. 申请讯飞语音 API key:https://console.xfyun.cn/app/myapp
  3. 项目代码中创建接口,把自己申请的Key写入即可。
package com.cstdr.chatgpt.model;
public interface API {
 String OPEN_AI = "sk-xxxx"; // Open AI
 String XF_SPEECH = "xxxx"; // 讯飞语音
}

App截图

技术方案

1.语音识别

目前考虑的方案:

  1. 科大讯飞(目前使用中)
  • 免费的话,语音听写和在线语音合成一年5万次交互量。
  1. 百度云、阿里云、腾讯云等云平台提供的功能

废弃的方案:

  1. 谷歌原生的语音识别(项目代码还在,已经注释)

优点:代码集成简单,维护方便。

缺点:使用需要科学魔法,可能会影响ChatGPT的沟通效率。后续扩展或者加入个性化语音需求比较麻烦。

  1. PocketSphinx on Android (https://cmusphinx.github.io/wiki/tutorialandroid/)

优点:离线语音识别,网上教程多。

缺点:集成有点复杂,并且没有个性化语音功能,很多教程都比较久远,维护难度大。

  1. 微软Azure(https://azure.microsoft.com/zh-cn/products/cognitive-services/speech-services/)
  • 免费版本:每月 5 小时免费音频,永久免费。
  • 注册需要VISA卡。 最后卡在VISA注册上,卡激活没问题,持卡人签名那边尝试各种办法怎么都过不去。。。

About

一个基于 ChatGPT API 的Android 语音助手

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

Contributors

Languages

AltStyle によって変換されたページ (->オリジナル) /