基于 FastAPI 和 DdddOcr 的高性能 OCR API 服务,提供图像文字识别、滑动验证码匹配和目标检测功能。
| 组件 | 版本 |
|---|---|
| 操作系统 | Linux(推荐 Ubuntu 20.04 LTS 或更高版本) |
| Docker | 20.10 或更高 |
| Docker Compose | 1.29 或更高 |
-
克隆仓库
git clone https://github.com/your-repo/ddddocr-api.git cd ddddocr-api -
启动服务
有三种方式可以启动应用:
a. 使用 docker启动:
- 构建 Docker 镜像 一键docker环境服务器购买,可一元试用
- 打包镜像
docker build -t ddddocr-api . - 启动镜像
docker run -d -p 8000:8000 --name ddddocr-api-container ddddocr-api
b. 使用 python 命令直接运行:
python app/main.py
b. 使用 uvicorn(支持热重载,适合开发):
uvicorn app.main:app --reload
-
验证服务
curl http://localhost:8000/docs
如果成功,您将看到 Swagger UI 文档页面。
-
停止服务
-
如果使用 Docker:
docker stop ddddocr-api-container
-
如果使用 Docker Compose:
docker-compose down
- 查看日志
-
如果使用 Docker:
docker logs ddddocr-api-container
-
如果使用 Docker Compose:
docker-compose logs
🔗 端点:POST /ocr
| 参数 | 类型 | 描述 |
|---|---|---|
file |
File | 图片文件(可选) |
image |
String | Base64 编码的图片字符串(可选) |
probability |
Boolean | 是否返回概率(默认:false) |
charsets |
String | 字符集(可选) |
png_fix |
Boolean | 是否进行 PNG 修复(默认:false) |
🔗 端点:POST /slide_match
| 参数 | 类型 | 描述 |
|---|---|---|
target_file |
File | 目标图片文件(可选)需要与target字段同时使用 |
target |
String | Base64 编码的目标图片字符串(可选) 需要与target_file字段同时使用 |
background_file |
File | 背景图片文件(可选) 需要与background字段同时使用 |
background |
String | Base64 编码的背景图片字符串(可选) 需要与background_file字段同时使用 |
simple_target |
Boolean | 是否使用简单目标(默认:false) |
target_file和target 为一组字段,background_file和background 为一组字段, 两组字段不可同时使用,同时使用则仅一组会生效 |
🔗 端点:POST /detection
| 参数 | 类型 | 描述 |
|---|---|---|
file |
File | 图片文件(可选) |
image |
String | Base64 编码的图片字符串(可选) |
Python
import requests import base64 url = "http://localhost:8000/ocr" image_path = "path/to/your/image.jpg" with open(image_path, "rb") as image_file: encoded_string = base64.b64encode(image_file.read()).decode('utf-8') data = { "image": encoded_string, "probability": False, "png_fix": False } response = requests.post(url, data=data) print(response.json())
Node.js
const axios = require('axios'); const fs = require('fs'); const url = 'http://localhost:8000/ocr'; const imagePath = 'path/to/your/image.jpg'; const imageBuffer = fs.readFileSync(imagePath); const base64Image = imageBuffer.toString('base64'); const data = { image: base64Image, probability: false, png_fix: false }; axios.post(url, data) .then(response => { console.log(response.data); }) .catch(error => { console.error('Error:', error); });
C#
using System; using System.Net.Http; using System.IO; using System.Threading.Tasks; class Program { static async Task Main(string[] args) { var url = "http://localhost:8000/ocr"; var imagePath = "path/to/your/image.jpg"; var imageBytes = File.ReadAllBytes(imagePath); var base64Image = Convert.ToBase64String(imageBytes); var client = new HttpClient(); var content = new MultipartFormDataContent(); content.Add(new StringContent(base64Image), "image"); content.Add(new StringContent("false"), "probability"); content.Add(new StringContent("false"), "png_fix"); var response = await client.PostAsync(url, content); var result = await response.Content.ReadAsStringAsync(); Console.WriteLine(result); } }
PHP
<?php $url = 'http://localhost:8000/ocr'; $imagePath = 'path/to/your/image.jpg'; $imageData = base64_encode(file_get_contents($imagePath)); $data = array( 'image' => $imageData, 'probability' => 'false', 'png_fix' => 'false' ); $options = array( 'http' => array( 'header' => "Content-type: application/x-www-form-urlencoded\r\n", 'method' => 'POST', 'content' => http_build_query($data) ) ); $context = stream_context_create($options); $result = file_get_contents($url, false, $context); echo $result; ?>
Go
package main import ( "bytes" "encoding/base64" "encoding/json" "fmt" "io/ioutil" "net/http" "net/url" ) func main() { apiURL := "http://localhost:8000/ocr" imagePath := "path/to/your/image.jpg" imageData, err := ioutil.ReadFile(imagePath) if err != nil { panic(err) } base64Image := base64.StdEncoding.EncodeToString(imageData) data := url.Values{} data.Set("image", base64Image) data.Set("probability", "false") data.Set("png_fix", "false") resp, err := http.PostForm(apiURL, data) if err != nil { panic(err) } defer resp.Body.Close() body, err := ioutil.ReadAll(resp.Body) if err != nil { panic(err) } fmt.Println(string(body)) }
易语言
.版本 2
.程序集 调用OCR接口
.子程序 主函数, 整数型
.局部变量 请求头, QQ.HttpHeaders
.局部变量 请求内容, QQ.HttpMultiData
.局部变量 图片路径, 文本型
.局部变量 图片数据, 字节集
.局部变量 HTTP, QQ.Http
图片路径 = "path/to/your/image.jpg"
图片数据 = 读入文件 (图片路径)
请求头.添加 ("Content-Type", "application/x-www-form-urlencoded")
请求内容.添加文本 ("image", 到Base64 (图片数据))
请求内容.添加文本 ("probability", "false")
请求内容.添加文本 ("png_fix", "false")
HTTP.发送POST请求 ("http://localhost:8000/ocr", 请求内容, 请求头)
调试输出 (HTTP.获取返回文本())
返回 (0)
注意:使用示例前,请确保安装了必要的依赖库,并根据实际环境修改服务器地址和图片路径。
- 确保防火墙允许访问 8000 端口。
- 生产环境建议配置 HTTPS 和适当的身份验证机制。
- 定期更新 Docker 镜像以获取最新的安全补丁和功能更新。
遇到问题?请检查以下几点:
- 确保 Docker 服务正在运行。
- 检查容器日志:
docker logs ddddocr-api-container
- 确保没有其他服务占用 8000 端口。
如果问题仍然存在,请提交 issue 到本项目的 GitHub 仓库。
本项目采用 MIT 许可证。详情请参见 LICENSE 文件。
Made with ❤️ by sml2h3