WikiMini

GPT-1

Generative Pre-trained Transformer 1 (GPT-1)
GeliştiriciOpenAI
Kod deposu Bunu Vikiveri'de düzenleyin
Türdil modeli
Resmî sitesiopenai.com/blog/language-unsupervised/ Bunu Vikiveri'de düzenleyin

GPT-1, OpenAI'nin GPT serisindeki ilk büyük bir dil modelidir. 8 Haziran 2018 yılında sunuldu. GPT-1, yaklaşık 110 milyon parametreye sahipti ve yalnızca dikkat mekanizmasını kullanarak metinleri anlamaya çalıştı.[1] Bu model, dil modellerinin doğruluğunu ve esnekliğini artırmanın yolunu açtı. 2019 yılında yerini daha gelişmiş GPT-2 aldı.

  1. ^ Radford, Alec; Wu, Jeffrey; Child, Rewon; Luan, David; Amodei, Dario; Sutskever, Ilua (14 Şubat 2019). "Language models are unsupervised multitask learners" (PDF). OpenAI. 1 (8). 6 Şubat 2021 tarihinde kaynağından arşivlendi (PDF)19 Aralık 2020. 

Dış bağlantılar

[değiştir | kaynağı değiştir]