Accede al código en GitHub: https://github.com/jamg-upv/LLMforSLRscreening/tree/main/ACEDE-ECNwsDic24 El vídeo describe un proceso de clasificación de textos utilizando modelos de lenguaje de gran tamaño (LLMs). Se simplifica el proceso usando un solo modelo de 384 tokens para clasificar artículos, calculando la similitud de coseno entre los vectores de los artículos y los vectores de diferentes categorías (como "empowerment" o "trabajo remoto"). El código, alojado en GitHub y ejecutable en Google Colab, permite la elección de la fuente de datos (GitHub o Google Drive) y genera un archivo Excel con los resultados ordenados por similitud para cada categoría. La eficiencia del proceso se evalúa monitoreando el consumo de RAM, demostrando la factibilidad incluso con recursos gratuitos.
1:40 · 2022
8:18 · 2011