Applicazioni pratiche di deep learning/Interrogare documenti(LLM)

Attraverso Llama 2, un Large Language Model (LLM) con parametri da 7 a 70 miliardi, alternativo a ChatGPT, rilasciato da Meta creatore di Facebook, si vuole interrogare un documento, fornito dal Partito Democratico, inerente la legge di bilancio del 2022. Tale documento scaricabile da qui in formato pdf, deve essere convertito in formato testo txt, tramite ad esempio il programma pdftotext, formattato in maniera comprensibile e tradotto in inglese, in modo da essere dato in pasto all'intelligenza artificiale di Llama 2.
Per utilizzare Llama 2 su Google Colab occorre innanzitutto avere un account su HuggingFace, accettare la licenza di Llama2 da |qui, aspettando al massimo 2 giorni, affinché avvenga l'approvazione da parte di Meta e poi fare una richiesta ad HuggingFace da qui per potere utilizzare il modello.
Fatto questo si può utilizzare il report su Colab da me realizzato, utilizzando questo notebook su Kaggle rilasciato con licenza Apache 2.0.
Cliccare sul seguente link ed eseguire il codice per fare domande al documento fornito dal Partito Democratico, dopo averlo tradotto in inglese e convertito in formato testo.