U-Turn OpenAI: Tidak Melatih GPT-4 Pada Data Pelanggan API

perubahan-privasi-openai-6457d3fd3d25f-sej-760x400.png

Dalam keputusan yang signifikan dari praktik sebelumnya, OpenAI telah mengumumkan bahwa mereka tidak akan lagi menggunakan data pelanggan yang dikirim melalui API-nya untuk melatih model bahasa luas mereka, seperti GPT-4.

Perubahan tersebut dikonfirmasi oleh Sam Altman, CEO OpenAI, dalam sebuah wawancara terbaru dengan CNBC.

Pendekatan Baru OpenAI terhadap Data Pengguna

Kebijakan perubahan OpenAI diterapkan pada tanggal 1 Maret 2023, ketika perusahaan diam-diam memperbarui syarat layanannya untuk mencerminkan komitmen baru terhadap privasi pengguna.

Altman menjelaskan, "Pelanggan jelas menginginkan kami untuk tidak melatih dengan menggunakan data mereka, jadi kami telah mengubah rencana kami: Kami tidak akan melakukannya."

API, atau antarmuka pemrograman aplikasi, adalah kerangka teknologi yang memungkinkan pelanggan terhubung langsung ke perangkat lunak OpenAI.

Altman menyatakan bahwa OpenAI telah tidak menggunakan data API untuk pelatihan model "selama beberapa waktu," mengindikasikan bahwa pengumuman resmi ini memformalisasi praktik yang sudah ada sebelumnya.

Dampak Bagi Pelanggan Bisnis

Langkah OpenAI ini memiliki implikasi yang luas, terutama bagi pelanggan bisnisnya, yang meliputi perusahaan-perusahaan raksasa seperti Microsoft, Salesforce, dan Snapchat.

Perusahaan-perusahaan ini lebih cenderung memanfaatkan kemampuan API OpenAI untuk operasional mereka, oleh karena itu perubahan privasi dan perlindungan data ini sangat relevan bagi mereka.

Namun, langkah-langkah perlindungan data baru hanya berlaku bagi pelanggan yang menggunakan layanan API perusahaan. Pembaruan syarat penggunaan OpenAI mencatat, "Kami dapat menggunakan Konten dari Layanan lain selain API kami."

Oleh karena itu, bentuk lain dari input data, seperti teks yang dimasukkan ke dalam chatbot populer ChatGPT, masih dapat digunakan oleh OpenAI kecuali data tersebut dibagikan melalui API.

Dampak yang Lebih Luas bagi Industri

Perubahan kebijakan OpenAI terjadi ketika industri berhadapan dengan dampak potensial dari model bahasa besar, seperti ChatGPT milik OpenAI, yang menggantikan materi yang biasanya dibuat oleh manusia.

Misalnya, Persatuan Penulis Amerika (Writers Guild of America) baru-baru ini mulai mogok setelah negosiasi antara Persatuan dan rumah produksi film terhenti. Persatuan telah memperjuangkan pembatasan penggunaan ChatGPT OpenAI untuk pembuatan atau penulisan naskah.

Keputusan OpenAI untuk tidak menggunakan data pelanggan untuk pelatihan adalah momen penting dalam perbincangan tentang privasi data dan AI yang sedang berlangsung. Ketika perusahaan terus mengeksplorasi dan mendorong batas-batas teknologi AI, memastikan privasi pengguna dan menjaga kepercayaan kemungkinan akan tetap menjadi pusat dalam perbincangan ini.

Evolusi ChatGPT: GPT-3 ke GPT-4

Penting untuk dicatat bahwa janji OpenAI untuk tidak menggunakan data pelanggan untuk pelatihan berlaku untuk model bahasa terbarunya, GPT-4, yang dirilis pada 14 Maret 2023.

GPT-4 memperkenalkan beberapa perbaikan dibandingkan pendahulunya, GPT-3, termasuk peningkatan yang signifikan dalam ukuran batas kata (25.000 dibandingkan dengan batas kata 3.000 dari ChatGPT), ukuran jendela konteks yang lebih besar, dan kemampuan penalaran dan pemahaman yang lebih baik.

Fitur lain yang mencolok dari GPT-4 adalah multi-modalitas, atau kemampuan untuk memahami dan menyimpulkan informasi dari gambar selain teks. Model terbaru ini menghasilkan teks yang lebih mirip dengan manusia, menggunakan fitur-fitur seperti emoji untuk kesan yang lebih personal.

Namun, ukuran dan arsitektur yang tepat dari GPT-4 tetap dirahasiakan, sehingga menimbulkan spekulasi tentang detail model tersebut.

Meskipun ada rumor-rumor tersebut, CEO OpenAI telah membantah klaim-klaim spesifik mengenai ukuran model tersebut.

Mengenai kinerja, GPT-4 telah menunjukkan keunggulan dalam generasi teks tetapi juga memiliki beberapa keterbatasan. Misalnya, ia mendapatkan skor di persentil ke-54 dalam Graduate Record Examination (GRE) Writing dan mencapai persentil ke-43 hingga ke-59 dalam ujian AP Calculus BC.

Selain itu, alat ini berhasil dalam tugas-tugas pemrograman Leetcode yang mudah, tetapi performanya menurun dengan kesulitan tugas yang meningkat.

Sementara rincian proses pelatihan GPT-4 tidak didokumentasikan secara resmi, diketahui bahwa model GPT umumnya melibatkan pembelajaran mesin skala besar dengan berbagai jenis teks internet.

Menantikan Ke Depan

Sebagai hasil dari perubahan kebijakan penggunaan data OpenAI, data yang digunakan untuk melatih model bahasa mereka tidak mencakup informasi yang dibagikan melalui API kecuali pengguna dengan tegas setuju untuk memberikannya untuk tujuan ini.

Sementara teknologi ini terus berkembang dan memainkan peran penting dalam kehidupan kita, menarik melihat bagaimana perusahaan menyesuaikan diri dan merespons kekhawatiran tentang menjaga data tetap privasi dan memperoleh kepercayaan dari masyarakat.

Buka kekuatan AI dengan HIX.AI!