🇬🇧 I worked on creating a finetuned model to detect texts generated by Chatgpt. For this project I decided to use the pre-trained model DistilBERT, and the Pytorch library. The dataset is from Hugging Face. The data comes from the social platform Reddit. This dataset consists of six subreddits (e.g., Finance, Medicine, Open Questions, etc.), each containing a set of questions with answers from humans and ChatGPT. I decided to fine-tune the pre-trained model using native PyTorch to identify generated texts.
🇫🇷 J'ai travaillé sur la création d'un modèle affiné pour détecter les textes générés par ChatGPT. Pour ce projet, j'ai décidé d'utiliser le modèle pré-entraîné DistilBERT et la bibliothèque Pytorch. Le jeu de données provient de Hugging Face. Les données proviennent de la plateforme sociale Reddit. Ce jeu de données est composé de six subreddits (par exemple, Finance, Médecine, Questions ouvertes, etc.), chacun contenant un ensemble de questions avec des réponses de la part d'humains et de ChatGPT. J'ai décidé d'adapter le modèle pré-entraîné en utilisant PyTorch pour identifier les textes générés par une IA.