LectureVoiceλ μκ° μ₯μ νμλ€μ΄ κ°μ μμμ λ³΄λ€ μ½κ² μ΄ν΄ν μ μλλ‘ μμ± ν΄μ€μ μλμΌλ‘ μμ±νμ¬ μ 곡νλ λͺ¨λ°μΌ μ ν리μΌμ΄μ μ λλ€.
- λΉλμ€ λΆμ λ° ν΄μ€ μμ±
- κ°μ μμμ λ€μ΄μ΄κ·Έλ¨κ³Ό ν μ€νΈλ₯Ό μΈμνκ³ , μμΈν μ€λμ€ ν΄μ€μ μ 곡ν©λλ€.
- νλ«νΌ
- λͺ¨λ°μΌ κΈ°κΈ°μμ μ¬μ©ν μ μλλ‘ μ€κ³λμμ΅λλ€.
- λͺ©ν
- μκ° μ₯μ νμλ€μκ² λ 립μ μ΄κ³ μ κ·Ό κ°λ₯ν νμ΅ κ²½νμ μ 곡ν©λλ€.
- ν΅μ¬ κΈ°λ₯
- λΉλμ€μ μκ° μμμ λν μ€λμ€ μ€λͺ μ μλ μμ±νμ¬ μ΄ν΄λλ₯Ό λμ λλ€.
COVID-19 ν¬λ°λ―Ή μ΄ν μ¨λΌμΈ νμ΅μ΄ μ¦κ°νλ©΄μ, μκ° μ₯μ νμλ€μ μκ°μ μ 보 μ κ·Όμ μ΄λ €μμ κ²ͺκ³ μμ΅λλ€. LectureVoiceλ κ°μ μμμ λ€μ΄μ΄κ·Έλ¨κ³Ό μκ° μλ£λ₯Ό λΆμνκ³ μ€λͺ νμ¬ μ΄λ¬ν λ¬Έμ λ₯Ό ν΄κ²°νκ³ μ ν©λλ€.
- μμ ν μμ± μ μ΄λ‘ μκ° μ₯μ μ¬μ©μκ° μ±κ³Ό μνΈμμ©ν μ μμ΅λλ€.
- LectureVoiceλ κ°μ λΉλμ€μ νλ©΄ μ νμ κ°μ§νκ³ , ν μ€νΈμ μ΄λ―Έμ§λ₯Ό μΆμΆνμ¬ μ€λͺ μ μμ±ν©λλ€.
- ν μ€νΈ, κ·Έλ¦Ό, ν, λ€μ΄μ΄κ·Έλ¨ λ± μκ°μ μλ£μ μ νμ λ§λ ν΄μ€ λ°©λ²μ μ ννμ¬ μ νν μ΄ν΄λ₯Ό λλ μμ± ν΄μ€μ μμ±ν©λλ€.
- λ§μΆ€ν μκ³ λ¦¬μ¦μ μ¬μ©νμ¬ λ€μ΄μ΄κ·Έλ¨μ νμ΄ν, λΈλ‘, ν μ€νΈλ₯Ό λΆμνκ³ , μλ―Έ μλ λ΄λ¬ν°λΈλ₯Ό μ 곡ν©λλ€.
LectureVoiceλ Dartμ Flutter νλ μμν¬λ‘ κ°λ°λ λͺ¨λ°μΌ μ ν리μΌμ΄μ μ λλ€. λ€μν λ°±μλ κΈ°μ κ³Ό APIκ° ν΅ν©λμ΄ μμ΅λλ€:
- μλ²: Flaskμ PythonμΌλ‘ κ°λ°
- ν μ€νΈ μΈμ: Naver Clova OCR API μ¬μ©
- μ΄λ―Έμ§ μΊ‘μ λ: Google Cloud Image Captioning API μ¬μ©
- μ€λμ€ μΆλ ₯: Google Cloud Text-to-Speech API μ¬μ©
- μ₯λ©΄ κ°μ§
- PySceneDetect APIλ₯Ό μ¬μ©νμ¬ μ₯λ©΄ μ νμ κ°μ§νκ³ , κ° μ ν μ§μ μμ μ΄λ―Έμ§λ₯Ό μΊ‘μ²ν©λλ€.
- ν
μ€νΈ μΆμΆ
- OCRμ ν΅ν΄ μΊ‘μ²λ μ΄λ―Έμ§μμ ν μ€νΈλ₯Ό μΆμΆνκ³ , κ³΅κ° μ’νμ ν¨κ» μ μ₯ν©λλ€.
- λ€μ΄μ΄κ·Έλ¨ λΆμ
- λ§μΆ€ν μκ³ λ¦¬μ¦μ μ¬μ©ν΄ λ€μ΄μ΄κ·Έλ¨μ λΆμνκ³ , μμΈν μ€λͺ μ μμ±ν©λλ€.
- ν΄μ€ μμ±
- μΆμΆλ ν μ€νΈμ μ΄λ―Έμ§ μ€λͺ μ μ’ ν©νμ¬ λΉλμ€ μ¬μκ³Ό λκΈ°νλ ν μ€νΈ νμΌμ μμ±ν©λλ€.
LectureVoiceμ μκ³ λ¦¬μ¦μ λ€μ΄μ΄κ·Έλ¨ μ΄λ―Έμ§μμ **λͺ¨μ(νμ΄ν, μ¬κ°ν)**μ κ°μ§νκ³ , ꡬ쑰νλ μ€λͺ μ μμ±ν©λλ€:
- μ€κ³½μ κ°μ§: λ€μ΄μ΄κ·Έλ¨μ κ°μ₯μ리λ₯Ό μλ³νκ³ , μ΄λ₯Ό νμ΄νλ λΈλ‘μΌλ‘ λΆλ₯ν©λλ€.
- ν μ€νΈ μ°κ΄μ± λΆμ: ν μ€νΈλ₯Ό λ€μ΄μ΄κ·Έλ¨ μμμ μ°κ²°νμ¬ κ΄κ³λ₯Ό μ€λͺ ν©λλ€.
- λ΄λ¬ν°λΈ μμ±: λ€μ΄μ΄κ·Έλ¨μ λν μΌκ΄λ μ€λͺ μ μμ±νμ¬ μκ° μ₯μ μ¬μ©μκ° λ³΅μ‘ν μκ° μ 보λ₯Ό μ΄ν΄ν μ μλλ‘ λμ΅λλ€.
LectureVoiceλ μ¬μ©μ± λ° λ§μ‘±λ νκ°μμ νμ€ μ΄λ―Έμ§ μΊ‘μ λ λ°©μλ³΄λ€ λμ μ΄ν΄λλ₯Ό 보μμ΅λλ€. μκ° μ₯μ νμλ€μ νΌλλ°±μ ν΄μ€μ λͺ νμ±κ³Ό μ μ©μ±μ κ°μ‘°νμ΅λλ€.
- μ±μ μ€ννκ³ κΈ°κΈ° κ°€λ¬λ¦¬μμ κ°μ λΉλμ€λ₯Ό μ ννμΈμ.
- μ±μ΄ λΉλμ€λ₯Ό μ²λ¦¬νκ³ , κ° μ₯λ©΄μ λν ν΄μ€μ μμ±ν©λλ€.
- λΉλμ€λ₯Ό μ¬μνμ¬ μ₯λ©΄ μ νλ§λ€ μ€λμ€ μ€λͺ μ λ€μ μ μμ΅λλ€.
LectureVoiceλ Android λ° iOS νλ«νΌμμ μ¬μ©ν μ μμ΅λλ€. μ€μΉ λ°©λ²μ λ€μκ³Ό κ°μ΅λλ€:
- λ ν¬μ§ν 리 ν΄λ‘ :
git clone https://github.com/nan0silver/DiagramAnalysisGenerationAlgorithm
- Dart & Flutter: flutter.dev
- Python & Flask: python.org, flask.palletsprojects.com
- PySceneDetect API: pyscenedetect.readthedocs.io
- Naver Clova OCR API: ncloud.com/product/aiService/ocr
- Google Cloud Text-to-Speech API: cloud.google.com/text-to-speech
- μμΈν λ΄μ©μ **ICICT 2024 Conference Paper**λ₯Ό μ°Έκ³ νμΈμ.