Top OpenAI's ChatGPT Gagal Saat Menjawab

OpenAIs-ChatGPT.jpg

Sudah hampir 6 bulan sekarang ChatGPT dari OpenAI telah diluncurkan. Faktanya, perusahaan baru-baru ini meluncurkan ChatGPT 4. Teknologi ini telah membawa dunia ke level yang lebih tinggi sekarang.

ChatGPT adalah model bahasa yang didukung oleh kecerdasan buatan (AI) dan telah dilatih untuk melaksanakan sejumlah aktivitas, termasuk penerjemahan bahasa, menyimpulkan informasi, dan menjawab pertanyaan. Kemampuan luar biasa dari model ini telah menarik perhatian yang cukup banyak, dan sebagai akibatnya, banyak orang mulai mempertanyakan prospek pekerjaan mereka.

Model pemrosesan bahasa GPT-4 dapat digunakan untuk menganalisis jumlah data yang besar, setelah itu dapat menghasilkan konten berdasarkan temuan dari analisis tersebut. Selain itu, teknologi baru ini mampu menganalisis sejumlah besar teks untuk menyajikan informasi kepada konsumen mengenai titik data tertentu.

Tidak ada keraguan bahwa teknologi akan tetap ada untuk waktu yang lama. Tentu saja, itu membantu pengguna dalam banyak cara. Pada banyak kesempatan, teknologi telah membuktikan kemampuannya untuk melakukan segalanya mulai dari menulis skrip hingga memecahkan soal ujian paling sulit. Tidak ada yang tidak dapat dicapai oleh ChatGPT. Namun, ada beberapa hal yang lebih sulit bagi ChatGPT juga.

1. ChatGPT yang didukung oleh kecerdasan buatan mengalami kemunduran ketika tidak mampu lulus ujian Joint Entrance Examination (JEE) yang bergengsi di India. Joint Entrance Examination terkenal karena tingkat kesulitannya dan menarik ribuan siswa setiap tahunnya yang berminat untuk diterima di perguruan tinggi teknik terbaik di India. Ini adalah salah satu ujian kuantitatif tersulit yang melibatkan diagram dan angka yang rumit.

Siswa yang tertarik untuk menghadiri lembaga pendidikan bergengsi seperti IIT dan NIT harus melewati ujian Joint Entrance Test terlebih dahulu. Menurut laporan, ChatGPT tidak tampil dengan baik dalam ujian JEE Advanced.

Hasil kinerja ChatGPT dalam tes kurang memuaskan karena hanya mampu menyelesaikan 11 dari total jumlah pertanyaan dalam kertas tersebut.

2. ChatGPT telah berhasil di masa lalu dalam sejumlah tes lain yang terkenal dan sulit. Secara mengesankan, ChatGPT mencoba dan berhasil menjawab semua 200 pertanyaan dalam Ujian Kelayakan dan Penerimaan Nasional untuk Kolese Kedokteran (NEET), yang membutuhkan kandidat menjawab 180 pertanyaan dari total 200.

Meskipun demikian, ChatGPT mencoba menjawab semua 200 pertanyaan, dan hasil kinerjanya adalah 359 dari 800. Secara khusus, ChatGPT berhasil dengan baik dalam komponen Biologi pada tes NEET, menunjukkan akurasi yang lebih baik dalam menjawab pertanyaan-pertanyaan yang diajukan dalam bagian tersebut. Kinerja ChatGPT dalam tes NEET mengindikasikan bahwa ia memiliki kemampuan untuk berhasil di domain-domain lain, meskipun ia tidak lulus ujian JEE Advanced.

Kekalahan yang dialami oleh ChatGPT dalam ujian JEE Advanced menunjukkan keterbatasan yang ada bahkan pada model AI paling canggih. Meskipun kecerdasan buatan memiliki potensi untuk mengganggu banyak industri yang berbeda, ia masih memiliki jalan yang panjang sebelum bisa bersaing dengan kecerdasan manusia dalam tugas yang sulit.

Chatbot ChatGPT dari OpenAI belum berhasil dalam ujian kompetitif lainnya.

3. ChatGPT mengikuti ujian Komisi Layanan Publik Persatuan (UPSC) atas permintaan Analytics India Magazine (AIM). Ujian UPSC dianggap sebagai salah satu ujian kompetitif yang paling sulit di dunia. Lebih dari 10 lakh calon peserta mengikuti ujian UPSC setiap tahun, tetapi hanya 5% dari mereka yang berhasil.

AIM menyediakan 100 pertanyaan kepada ChatGPT dari UPSC Prelims 2022.

Chatbot tersebut tampil buruk pada ujian UPSC Prelims 2022, hanya mencetak skor 54 dari 100 pada Kertas Soal 1 (Set A) ketika skor yang dibutuhkan adalah 87.54. Hal ini menandakan bahwa ChatGPT tidak lulus ujian UPSC.

Pertanyaan didasarkan pada topik-topik dalam sains umum India, sejarah, geografi, ekonomi, ekologi, dan peristiwa terkini. Chatbot ini berjalan baik dengan pertanyaan mengenai lokasi dan ekonomi, tetapi gagal total ketika ditanyakan tentang peristiwa sejarah yang terjadi sebelum tahun 2021.

Fakta bahwa set data ChatGPT hanya mencakup tahun 2021 mungkin menjadi faktor penentu dalam ketidakmampuan bot AI ini untuk menjawab dengan benar semua pertanyaan dalam ujian tersebut.

4. Selain itu, hasil ujian CLAT untuk ChatGPT juga di atas rata-rata. Selama ujian CLAT UG, alat kecerdasan buatan ini hanya berhasil secara akurat menjawab 50,83 persen pertanyaan. ChatGPT tidak berhasil dalam kategori pertanyaan logika dan kuantitatif. Namun, dalam kategori Bahasa Inggris dan Berita Terkini, ChatGPT sangat berhasil. Namun, alat ini mengalami kesulitan yang sangat besar dalam menjawab pertanyaan berdasarkan konsep.

Dirilis pada November 2022, ChatGPT telah cukup sukses di Amerika Serikat. Teknologi kecerdasan buatan ini telah berhasil lulus dalam Ujian Lisensi Medis Amerika Serikat (USMLE) dan berbagai ujian MBA di AS. Selain itu, ia juga berhasil lulus dalam Wawancara Koding Google untuk Insinyur Level 3.

Para profesional veteriner terkejut baru-baru ini ketika ChatGPT mampu mendiagnosis dengan benar kondisi seekor anjing dan menyelamatkan nyawa hewan tersebut.

Banyak negara, namun, kini mempunyai pandangan berbeda mengenai ChatGPT dan siap mengambil tindakan tegas terhadap inovasi baru ini. Baru-baru ini, teknologi ini telah dilarang di dua negara besar, termasuk Jerman dan Italia. Negara-negara ini mengklaim bahwa ChatGPT dari OpenAI kurang memiliki perlindungan untuk mencegah anak-anak terpapar materi yang mengandung konten ofensif, seperti sistem verifikasi usia.

Ulrich Kelber, komisioner perlindungan data Jerman, telah mengeluarkan peringatan bahwa Chat-GPT mungkin akan dilarang di Jerman karena kekhawatiran mengenai keamanan data pengguna, seperti yang terjadi di Italia.

Nah, mari kita lihat bagaimana teknologi yang didukung kecerdasan buatan akan berperilaku di masa depan.

Terima kasih telah membaca! Tetaplah berada di sini untuk artikel-informasi lainnya!

Buka kekuatan AI dengan HIX.AI!