Abstrak/Abstract |
Penilaian tes uraian merupakan salah satu penilaian untuk mengetahui kemampuan siswa secara mendalam.UKARA merupakan pengembangan automatic essay scoringyang menggabungkan NLP danmachine learning.Penelitian ini menggunakan dataset yang disediakan untuk UKARA challenge yang terdiri dari 2 jenis, dataset A dan B. Dataset yang disediakan masih sedikit untuk proses pembuatan model sehinggamenjadi salah satu penyebab model yang dihasilkan belum maksimal.Penelitian ini fokus pada proses penambahan atauaugmentasi datadengan menggunakan EDA (Easy Data Augmentation Techniques). Ada empat metode yang diterapkan yaitu Synonym Replacement (SR), Random Insertion (RI), Random Swab (RS), dan Random Deletion (RD).Datayang digunakan untuk pembuatan modeldengan menggunakan metodeBiLSTM.Performamodeldievaluasimenggunakanconfusion matrix dengan nilaiaccuracy,precision,recalldan f-measure.Hasil penelitian menunjukkan bahwa pada dataset Atanpa augmentasidengan menggunakan k-fold cross validation mengasilkan nilai akurasi tertinggi dengan nilai 85.07% . Sedangkan hasil pada data B menunjukkan EDA insert dengan k-fold cross validation sebesar 72.78%. |