Ada juga berbagai jenis data yang dapat digunakan untuk melatih model, seperti data terstruktur, data tidak terstruktur, data berlabel, atau data tidak berlabel.
Data terstruktur adalah data yang memiliki format yang tetap dan jelas, seperti tabel, grafik, atau formulir. Data tidak terstruktur adalah data yang memiliki format yang bervariasi dan tidak jelas, seperti teks, gambar, atau suara.
Data berlabel adalah data yang memiliki informasi tambahan yang menunjukkan kategori, sifat, atau tujuan dari data, seperti genre, sentimen, atau inten. Data tidak berlabel adalah data yang tidak memiliki informasi tambahan tersebut.
Model dan data yang digunakan untuk membuat karya tulis otomatis dapat berbeda-beda tergantung pada tujuan, topik, dan gaya penulisan yang diinginkan.
Misalnya, jika tujuannya adalah untuk membuat karya tulis ilmiah, maka model yang digunakan harus dapat menghasilkan teks yang formal, logis, dan objektif, serta data yang digunakan harus berasal dari sumber yang kredibel, relevan, dan terkini.