Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

cuban-digital-language

Como es el español digital cubano❓

1- Mineria de datos :

  • redes sociales
    • Twitter (Scrapper) ✅
    • Youtube (API) ✅
    • CubaDebate (Scrapper) ✅
    • Facebook (Scrapper) ✅
    • Instagram
    • Whatsapp
    • Telegram ✅
    • Revolico
  • Corpus de la RAE (pyrae❓)

2- Análisis de palabras ajenas a la RAE:

  • Cantidad de diminutivos
    • Como reconocer diminutivos y sus significados
      • IA❓ Se puede hacer un modelo que dadas las principales reglas generadoras de diminutivos infiera el significado?
  • Cantidad de palabras de otros ideomas (inicialmente el ingles)
    • Corpus equivalente a la RAE en ingles?
  • Cantidad de faltas de ortografía:
    • IA❓ Un modelo que se aprenda los distintos corpus y dada un error diga la palabra real?

3- Análisis de texto:

  • Aplicar un MRI (Modelo de Recuperación de Información) sobre el corpus de todos los textos recolectados (SRI🔍📰)
  • Con la información de la RAE, los diminutivos, las faltas y las palabras en ingles generar un thesaurus (SRI🔍📰)
  • Dado una consulta hacer expanción de consulta apoyado en el thesaurus y recuperar los textos más relevantes (SRI🔍📰)
  • Dado el corpus de comentarios automatizar la generación de nuevos comentarios (IA🧠💻)
  • Mezclar los comentarios generados con los recuperados y proponer al lector detectar la IA (PD 📰🧑🏿‍💻)
  • Obterner retroalimentación del juego tanto para el SRI como para la IA
  • Empleando detección de contenidos y clustering generar curpos de prueba para evaluar el SRI (IA🧠💻)

4- Artículo de Periodismo de Datos y posicionamiento del repo

  • Usar las técnicas de SEO para ganar posicionamiento del artículo y de esta organizacion y sus repos (SRI🔍📰)

Pinned Loading

  1. methodology methodology Public

    List of documents that explain each of the organization's jobs

    1

  2. Models-for-Information-Retrieval Models-for-Information-Retrieval Public

    Some models for information retrieval in Spanish text corpus of the Cuban social network

    Python

  3. nlp-probabilistic-text-generator nlp-probabilistic-text-generator Public

    🤖Machine Learning model to generate text. It uses the structure and model of the language, and probabilistic tools such as Markov's chains and hidden processes.

    Jupyter Notebook

  4. nlp-rnn-text-generator nlp-rnn-text-generator Public

    🤖 Recurrent neural network to text generate

    Jupyter Notebook

  5. corpus-cluster-by-autoencode corpus-cluster-by-autoencode Public

    Python

  6. content-detection-and-corpus-clustering content-detection-and-corpus-clustering Public

    Jupyter Notebook

Repositories

Loading
Type
Select type
Language
Select language
Sort
Select order
Showing 10 of 19 repositories

Top languages

Loading...

Most used topics

Loading...

AltStyle によって変換されたページ (->オリジナル) /