Analisis sentimen (juga dikenal sebagai penambangan opini atau AI emosi) adalah penggunaan pemrosesan bahasa alami, analisis teks, linguistik komputasional, danbiometrikuntuk mengidentifikasi, mengekstrak, mengukur, dan mempelajari keadaan afektif dan informasi subjektif secara sistematis. Analisis sentimen secara luas diterapkanpada materi suarapelanggan seperti ulasan dan tanggapan survei, media online dan sosial, dan materi perawatan kesehatan untuk aplikasi yang berkisar daripemasaranhinggalayanan pelangganhingga pengobatan klinis. Dengan munculnya model bahasa yang dalam, seperti RoBERTa, juga domain data yang lebih sulit dapat dianalisis, misalnya, teks berita di mana penulis biasanya mengekspresikan pendapat / sentimen mereka secara kurang eksplisit
Tugas dasar dalam analisis sentimen adalah mengklasifikasikan polaritas teks yang diberikan pada tingkat dokumen, kalimat, atau fitur/aspek—apakah pendapat yang diungkapkan dalam dokumen, kalimat, atau fitur/aspek entitas positif, negatif, atau netral. Klasifikasi sentimen "di luar polaritas" tingkat lanjut terlihat, misalnya, pada keadaan emosional seperti kenikmatan, kemarahan, jijik, kesedihan, ketakutan, dan kejutan.
Pendekatan yang ada untuk analisis sentimen dapat dikelompokkan ke dalam tiga kategori utama: teknik berbasis pengetahuan, metode statistik, dan pendekatan hibrida. Teknik berbasis pengetahuan mengklasifikasikan teks berdasarkan kategori pengaruh berdasarkan adanya kata-kata pengaruh yang tidak ambigu seperti bahagia, sedih, takut, dan bosan. Beberapa basis pengetahuan tidak hanya mencantumkan kata-kata yang mempengaruhi dengan jelas, tetapi juga menetapkan kata-kata sewenang-wenang yang mungkin "afinitas" untuk emosi tertentu. Metode statistik memanfaatkan elemen dari pembelajaran mesin seperti analisis semantik laten, mendukung mesin vektor, "kantong kata", "Informasi Timbal Balik Runcing" untuk Orientasi Semantik,[6] model ruang semantikatau modelpenyematan kata, dan pembelajaran mendalam . Metode yang lebih canggih mencoba mendeteksi pemegang sentimen (yaitu, orang yang mempertahankan keadaan afektif itu) dan target (yaitu, entitas yang pengaruhnya dirasakan). Untuk menambang pendapat dalam konteks dan mendapatkan fitur yang menurut pembicara, hubungan tata bahasa kata-kata digunakan. Hubungan ketergantungan gramatikal diperoleh dengan penguraian teks yang mendalam. Pendekatan hibrida memanfaatkan pembelajaran mesin dan elemen dari representasi pengetahuan seperti ontologi dan jaringan semantik untuk mendeteksi semantik yang di ekspresikan secara halus, misalnya, melalui analisis konsep yang tidak secara eksplisit menyampaikan informasi yang relevan, tetapi yang secara implisit terkait dengan konsep lain yang melakukannya.