• Kami

Validasi model penambangan data terhadap metode estimasi usia gigi tradisional di kalangan remaja Korea dan orang dewasa muda

Terima kasih telah mengunjungi Nature.com. Versi browser yang Anda gunakan memiliki dukungan CSS terbatas. Untuk hasil terbaik, kami sarankan menggunakan versi yang lebih baru dari browser Anda (atau mematikan mode kompatibilitas di Internet Explorer). Sementara itu, untuk memastikan dukungan yang berkelanjutan, kami menunjukkan situs tanpa gaya atau javascript.
Gigi dianggap sebagai indikator yang paling akurat dari usia tubuh manusia dan sering digunakan dalam penilaian usia forensik. Kami bertujuan untuk memvalidasi estimasi usia gigi berbasis penambangan data dengan membandingkan akurasi estimasi dan kinerja klasifikasi ambang batas 18 tahun dengan metode tradisional dan estimasi usia berbasis penambangan data. Sebanyak 2657 radiografi panorama dikumpulkan dari warga Korea dan Jepang berusia 15 hingga 23 tahun. Mereka dibagi menjadi satu set pelatihan, masing -masing berisi 900 radiografi Korea, dan set uji internal yang berisi 857 radiografi Jepang. Kami membandingkan akurasi klasifikasi dan efisiensi metode tradisional dengan set uji model penambangan data. Keakuratan metode tradisional pada set uji internal sedikit lebih tinggi dari model penambangan data, dan perbedaannya kecil (rata -rata kesalahan absolut <0,21 tahun, kesalahan root mean square <0,24 tahun). Kinerja klasifikasi untuk cutoff 18 tahun juga serupa antara metode tradisional dan model penambangan data. Dengan demikian, metode tradisional dapat digantikan oleh model penambangan data saat melakukan penilaian usia forensik menggunakan kematangan molar kedua dan ketiga pada remaja Korea dan dewasa muda.
Estimasi usia gigi banyak digunakan dalam kedokteran forensik dan kedokteran gigi anak. Secara khusus, karena korelasi yang tinggi antara usia kronologis dan perkembangan gigi, penilaian usia dengan tahap perkembangan gigi adalah kriteria penting untuk menilai usia anak -anak dan remaja1,2,3. Namun, untuk kaum muda, memperkirakan usia gigi berdasarkan kematangan gigi memiliki keterbatasan karena pertumbuhan gigi hampir lengkap, dengan pengecualian molar ketiga. Tujuan hukum untuk menentukan usia anak muda dan remaja adalah untuk memberikan perkiraan yang akurat dan bukti ilmiah apakah mereka telah mencapai usia mayoritas. Dalam praktik medico-legal remaja dan orang dewasa muda di Korea, usia diperkirakan menggunakan metode Lee, dan ambang hukum 18 tahun diprediksi berdasarkan data yang dilaporkan oleh Oh et al 5.
Pembelajaran mesin adalah jenis kecerdasan buatan (AI) yang berulang kali mempelajari dan mengklasifikasikan sejumlah besar data, memecahkan masalah sendiri, dan mendorong pemrograman data. Pembelajaran mesin dapat menemukan pola tersembunyi yang berguna dalam volume data6 yang besar. Sebaliknya, metode klasik, yang padat karya dan memakan waktu, mungkin memiliki keterbatasan ketika berhadapan dengan volume besar data kompleks yang sulit diproses secara manual7. Oleh karena itu, banyak penelitian telah dilakukan baru -baru ini menggunakan teknologi komputer terbaru untuk meminimalkan kesalahan manusia dan memproses data multidimensi secara efisien8,9,10,11,12. Secara khusus, pembelajaran mendalam telah banyak digunakan dalam analisis gambar medis, dan berbagai metode untuk estimasi usia dengan secara otomatis menganalisis radiografi telah dilaporkan untuk meningkatkan akurasi dan efisiensi estimasi usia13,14,15,16,17,18,19,20 . Sebagai contoh, Halabi et al 13 mengembangkan algoritma pembelajaran mesin berdasarkan jaringan saraf konvolusional (CNN) untuk memperkirakan usia kerangka menggunakan radiografi tangan anak -anak. Studi ini mengusulkan model yang menerapkan pembelajaran mesin pada gambar medis dan menunjukkan bahwa metode ini dapat meningkatkan akurasi diagnostik. Li et al14 Perkiraan usia dari gambar x-ray panggul menggunakan CNN pembelajaran mendalam dan membandingkannya dengan hasil regresi menggunakan estimasi tahap osifikasi. Mereka menemukan bahwa model CNN pembelajaran mendalam menunjukkan kinerja estimasi usia yang sama dengan model regresi tradisional. Studi Guo et al. [15] mengevaluasi kinerja klasifikasi toleransi usia dari teknologi CNN berdasarkan ortofot gigi, dan hasil model CNN membuktikan bahwa manusia mengungguli kinerja klasifikasi usianya.
Sebagian besar studi tentang estimasi usia menggunakan pembelajaran mesin menggunakan metode pembelajaran mendalam13,14,15,16,17,18,19,20. Estimasi usia berdasarkan pembelajaran mendalam dilaporkan lebih akurat daripada metode tradisional. Namun, pendekatan ini memberikan sedikit kesempatan untuk menyajikan dasar ilmiah untuk perkiraan usia, seperti indikator usia yang digunakan dalam perkiraan. Ada juga perselisihan hukum tentang siapa yang melakukan inspeksi. Oleh karena itu, estimasi usia berdasarkan pembelajaran mendalam sulit diterima oleh otoritas administrasi dan yudisial. Data Mining (DM) adalah teknik yang dapat menemukan tidak hanya informasi yang diharapkan tetapi juga tidak terduga sebagai metode untuk menemukan korelasi yang berguna antara sejumlah besar data6,21,22. Pembelajaran mesin sering digunakan dalam penambangan data, dan baik penambangan data dan pembelajaran mesin menggunakan algoritma kunci yang sama untuk menemukan pola dalam data. Estimasi usia menggunakan pengembangan gigi didasarkan pada penilaian pemeriksa tentang kematangan gigi target, dan penilaian ini dinyatakan sebagai tahap untuk setiap gigi target. DM dapat digunakan untuk menganalisis korelasi antara tahap penilaian gigi dan usia aktual dan memiliki potensi untuk menggantikan analisis statistik tradisional. Oleh karena itu, jika kami menerapkan teknik DM untuk estimasi usia, kami dapat menerapkan pembelajaran mesin dalam estimasi usia forensik tanpa khawatir tentang kewajiban hukum. Beberapa studi perbandingan telah diterbitkan pada kemungkinan alternatif untuk metode manual tradisional yang digunakan dalam praktik forensik dan metode berbasis EBM untuk menentukan usia gigi. Shen et al23 menunjukkan bahwa model DM lebih akurat daripada formula camerer tradisional. Galibourg et al24 menerapkan metode DM yang berbeda untuk memprediksi usia sesuai dengan kriteria Demirdjian25 dan hasilnya menunjukkan bahwa metode DM mengungguli metode Demirdjian dan Willems dalam memperkirakan usia populasi Prancis.
Untuk memperkirakan usia gigi remaja Korea dan orang dewasa muda, Lee's Method 4 banyak digunakan dalam praktik forensik Korea. Metode ini menggunakan analisis statistik tradisional (seperti regresi berganda) untuk menguji hubungan antara subjek Korea dan usia kronologis. Dalam penelitian ini, metode estimasi usia yang diperoleh dengan menggunakan metode statistik tradisional didefinisikan sebagai "metode tradisional." Metode Lee adalah metode tradisional, dan akurasinya telah dikonfirmasi oleh Oh et al. 5; Namun, penerapan estimasi usia berdasarkan model DM dalam praktik forensik Korea masih dipertanyakan. Tujuan kami adalah untuk memvalidasi potensi kegunaan estimasi usia secara ilmiah berdasarkan model DM. Tujuan dari penelitian ini adalah (1) untuk membandingkan keakuratan dua model DM dalam memperkirakan usia gigi dan (2) untuk membandingkan kinerja klasifikasi 7 model DM pada usia 18 tahun dengan yang diperoleh dengan menggunakan metode statistik tradisional jatuh tempo kedewasaan kedua dan molar ketiga di kedua rahang.
Sarana dan standar deviasi usia kronologis demi tahap dan jenis gigi ditampilkan secara online dalam Tabel Tambahan S1 (set pelatihan), Tabel Tambahan S2 (set tes internal), dan Tabel Tambahan S3 (set tes eksternal). Nilai Kappa untuk reliabilitas intra dan interobserver yang diperoleh dari set pelatihan masing-masing adalah 0,951 dan 0,947. Nilai P dan interval kepercayaan 95% untuk nilai -nilai kappa ditunjukkan pada Tabel Tambahan Online S4. Nilai Kappa ditafsirkan sebagai "hampir sempurna", konsisten dengan kriteria Landis dan Koch26.
Saat membandingkan rata -rata kesalahan absolut (MAE), metode tradisional sedikit mengungguli model DM untuk semua jenis kelamin dan dalam set tes pria eksternal, dengan pengecualian multilayer perceptron (MLP). Perbedaan antara model tradisional dan model DM pada set uji MAE internal adalah 0,12-0,19 tahun untuk pria dan 0,17-0,21 tahun untuk wanita. Untuk baterai uji eksternal, perbedaannya lebih kecil (0,001-0,05 tahun untuk pria dan 0,05-0,09 tahun untuk wanita). Selain itu, root mean square error (RMSE) sedikit lebih rendah dari metode tradisional, dengan perbedaan yang lebih kecil (0,17-0,24, 0,2-0,24 untuk set uji internal pria, dan 0,03-0,07, 0,04-0,08 untuk set uji eksternal). ). MLP menunjukkan kinerja yang sedikit lebih baik daripada pelapisan lapisan tunggal (SLP), kecuali dalam kasus set tes eksternal betina. Untuk MAE dan RMSE, skor tes eksternal lebih tinggi dari set uji internal untuk semua jenis kelamin dan model. Semua MAE dan RMSE ditunjukkan pada Tabel 1 dan Gambar 1.
MAE dan RMSE model regresi tradisional dan penambangan data. Rata -rata kesalahan absolut MAE, root mean square error rmse, pelapis tunggal slp, multilayer perceptron MLP, metode CM tradisional.
Kinerja klasifikasi (dengan cutoff 18 tahun) dari model tradisional dan DM ditunjukkan dalam hal sensitivitas, spesifisitas, nilai prediktif positif (PPV), nilai prediktif negatif (NPV), dan area di bawah kurva karakteristik operasi penerima (AUROC) 27 (Tabel 2, Gambar 2 dan Tambahan Gambar 1 Online). Dalam hal sensitivitas baterai uji internal, metode tradisional berkinerja terbaik di antara pria dan lebih buruk di antara wanita. Namun, perbedaan dalam kinerja klasifikasi antara metode tradisional dan SD adalah 9,7% untuk pria (MLP) dan hanya 2,4% untuk wanita (XGBoost). Di antara model DM, regresi logistik (LR) menunjukkan sensitivitas yang lebih baik pada kedua jenis kelamin. Mengenai spesifisitas set uji internal, diamati bahwa empat model SD berkinerja baik pada pria, sedangkan model tradisional berkinerja lebih baik pada wanita. Perbedaan dalam kinerja klasifikasi untuk pria dan wanita masing -masing adalah 13,3% (MLP) dan 13,1% (MLP), menunjukkan bahwa perbedaan dalam kinerja klasifikasi antara model melebihi sensitivitas. Di antara model DM, mesin vektor pendukung (SVM), Decision Tree (DT), dan model Random Forest (RF) berkinerja terbaik di antara laki -laki, sedangkan model LR melakukan yang terbaik di antara wanita. Auroc dari model tradisional dan semua model SD lebih besar dari 0,925 (tetangga K-Nearest (KNN) pada pria), menunjukkan kinerja klasifikasi yang sangat baik dalam membedakan sampel berusia 18 tahun28. Untuk set tes eksternal, ada penurunan kinerja klasifikasi dalam hal sensitivitas, spesifisitas, dan AUROC dibandingkan dengan set uji internal. Selain itu, perbedaan sensitivitas dan spesifisitas antara kinerja klasifikasi model terbaik dan terburuk berkisar antara 10% hingga 25% dan lebih besar dari perbedaan dalam set uji internal.
Sensitivitas dan spesifisitas model klasifikasi penambangan data dibandingkan dengan metode tradisional dengan cutoff 18 tahun. Knn K tetangga terdekat, mesin vektor pendukung SVM, regresi logistik LR, pohon keputusan DT, hutan acak RF, xgb xgboost, perceptron multilayer MLP, metode CM tradisional.
Langkah pertama dalam penelitian ini adalah membandingkan keakuratan estimasi usia gigi yang diperoleh dari tujuh model DM dengan yang diperoleh menggunakan regresi tradisional. MAE dan RMSE dievaluasi dalam set tes internal untuk kedua jenis kelamin, dan perbedaan antara metode tradisional dan model DM berkisar antara 44 hingga 77 hari untuk MAE dan dari 62 hingga 88 hari untuk RMSE. Meskipun metode tradisional sedikit lebih akurat dalam penelitian ini, sulit untuk menyimpulkan apakah perbedaan kecil seperti itu memiliki signifikansi klinis atau praktis. Hasil ini menunjukkan bahwa keakuratan estimasi usia gigi menggunakan model DM hampir sama dengan metode tradisional. Perbandingan langsung dengan hasil dari penelitian sebelumnya sulit karena tidak ada penelitian yang membandingkan akurasi model DM dengan metode statistik tradisional menggunakan teknik yang sama untuk merekam gigi dalam rentang usia yang sama seperti dalam penelitian ini. Galibourg et al24 membandingkan MAE dan RMSE antara dua metode tradisional (Metode Demirjian25 dan Metode Willems29) dan 10 model DM dalam populasi Prancis berusia 2 hingga 24 tahun. Mereka melaporkan bahwa semua model DM lebih akurat daripada metode tradisional, dengan perbedaan 0,20 dan 0,38 tahun di MAE dan 0,25 dan 0,47 tahun di RMSE dibandingkan dengan metode Willems dan Demirdjian. Perbedaan antara model SD dan metode tradisional yang ditunjukkan dalam studi Halibourg memperhitungkan banyak laporan30,31,32,33 bahwa metode Demirdjian tidak secara akurat memperkirakan usia gigi dalam populasi selain dari Kanada Prancis yang menjadi dasar penelitian. Dalam studi ini. Tai et al 34 menggunakan algoritma MLP untuk memprediksi usia gigi dari 1636 foto ortodontik Cina dan membandingkan akurasinya dengan hasil metode Demirjian dan Willems. Mereka melaporkan bahwa MLP memiliki akurasi yang lebih tinggi daripada metode tradisional. Perbedaan antara metode demirdjian dan metode tradisional adalah <0,32 tahun, dan metode Willems adalah 0,28 tahun, yang mirip dengan hasil penelitian ini. Hasil penelitian sebelumnya24,34 juga konsisten dengan hasil penelitian ini, dan akurasi estimasi usia model DM dan metode tradisional serupa. Namun, berdasarkan hasil yang disajikan, kami hanya dapat dengan hati -hati menyimpulkan bahwa penggunaan model DM untuk memperkirakan usia dapat menggantikan metode yang ada karena kurangnya studi komparatif dan referensi sebelumnya. Studi tindak lanjut menggunakan sampel yang lebih besar diperlukan untuk mengkonfirmasi hasil yang diperoleh dalam penelitian ini.
Di antara penelitian yang menguji akurasi SD dalam memperkirakan usia gigi, beberapa menunjukkan akurasi yang lebih tinggi daripada penelitian kami. Stepanovsky et al 35 menerapkan 22 model SD untuk radiografi panorama dari 976 penduduk Ceko berusia 2,7 hingga 20,5 tahun dan menguji keakuratan masing -masing model. Mereka menilai pengembangan total 16 gigi permanen kiri dan bawah menggunakan kriteria klasifikasi yang diusulkan oleh Moorrees et al 36. MAE berkisar dari 0,64 hingga 0,94 tahun dan RMSE berkisar dari 0,85 hingga 1,27 tahun, yang lebih akurat daripada dua model DM yang digunakan dalam penelitian ini. Shen et al23 menggunakan metode cameriere untuk memperkirakan usia gigi tujuh gigi permanen di mandibula kiri pada penduduk Tiongkok timur berusia 5 hingga 13 tahun dan membandingkannya dengan usia yang diperkirakan menggunakan regresi linier, SVM dan RF. Mereka menunjukkan bahwa ketiga model DM memiliki akurasi yang lebih tinggi dibandingkan dengan formula cameriere tradisional. MAE dan RMSE dalam penelitian Shen lebih rendah dari pada model DM dalam penelitian ini. Peningkatan ketepatan studi oleh Stepanovsky et al. 35 dan Shen et al. 23 mungkin disebabkan oleh dimasukkannya subjek yang lebih muda dalam sampel penelitian mereka. Karena perkiraan usia untuk peserta dengan gigi berkembang menjadi lebih akurat karena jumlah gigi meningkat selama perkembangan gigi, keakuratan metode estimasi usia yang dihasilkan dapat dikompromikan ketika peserta penelitian lebih muda. Selain itu, kesalahan MLP dalam estimasi usia sedikit lebih kecil dari SLP, yang berarti bahwa MLP lebih akurat daripada SLP. MLP dianggap sedikit lebih baik untuk estimasi usia, mungkin karena lapisan tersembunyi di MLP38. Namun, ada pengecualian untuk sampel luar wanita (SLP 1.45, MLP 1.49). Temuan bahwa MLP lebih akurat daripada SLP dalam menilai usia membutuhkan studi retrospektif tambahan.
Kinerja klasifikasi model DM dan metode tradisional pada ambang batas 18 tahun juga dibandingkan. Semua model SD yang diuji dan metode tradisional pada set tes internal menunjukkan tingkat diskriminasi yang dapat diterima secara praktis untuk sampel berusia 18 tahun. Sensitivitas untuk pria dan wanita masing -masing lebih besar dari 87,7% dan 94,9%, dan spesifisitas lebih besar dari 89,3% dan 84,7%. Auroc dari semua model yang diuji juga melebihi 0,925. Sejauh pengetahuan kami, tidak ada penelitian yang menguji kinerja model DM untuk klasifikasi 18 tahun berdasarkan kedewasaan gigi. Kami dapat membandingkan hasil penelitian ini dengan kinerja klasifikasi model pembelajaran mendalam pada radiografi panorama. Guo et al.15 menghitung kinerja klasifikasi model pembelajaran mendalam berbasis CNN dan metode manual berdasarkan metode Demirjian untuk ambang batas usia tertentu. Sensitivitas dan spesifisitas metode manual masing -masing adalah 87,7% dan 95,5%, dan sensitivitas dan spesifisitas model CNN masing -masing melebihi 89,2% dan 86,6%. Mereka menyimpulkan bahwa model pembelajaran yang mendalam dapat menggantikan atau mengungguli penilaian manual dalam mengklasifikasikan ambang batas usia. Hasil penelitian ini menunjukkan kinerja klasifikasi yang sama; Dipercayai bahwa klasifikasi menggunakan model DM dapat menggantikan metode statistik tradisional untuk estimasi usia. Di antara model, DM LR adalah model terbaik dalam hal sensitivitas untuk sampel pria dan sensitivitas dan spesifisitas untuk sampel wanita. LR berada di peringkat kedua dalam kekhususan untuk pria. Selain itu, LR dianggap sebagai salah satu model DM35 yang lebih ramah pengguna dan kurang kompleks dan sulit diproses. Berdasarkan hasil ini, LR dianggap sebagai model klasifikasi cutoff terbaik untuk anak berusia 18 tahun dalam populasi Korea.
Secara keseluruhan, keakuratan estimasi usia atau kinerja klasifikasi pada set uji eksternal buruk atau lebih rendah dibandingkan dengan hasil pada set tes internal. Beberapa laporan menunjukkan bahwa akurasi atau efisiensi klasifikasi berkurang ketika perkiraan usia berdasarkan populasi Korea diterapkan pada populasi Jepang5,39, dan pola yang sama ditemukan dalam penelitian ini. Tren kerusakan ini juga diamati dalam model DM. Oleh karena itu, untuk memperkirakan usia secara akurat, bahkan ketika menggunakan DM dalam proses analisis, metode yang berasal dari data populasi asli, seperti metode tradisional, harus lebih disukai5,39,40,41,42. Karena tidak jelas apakah model pembelajaran yang mendalam dapat menunjukkan tren yang sama, studi yang membandingkan akurasi klasifikasi dan efisiensi menggunakan metode tradisional, model DM, dan model pembelajaran mendalam pada sampel yang sama diperlukan untuk mengkonfirmasi apakah kecerdasan buatan dapat mengatasi perbedaan rasial ini pada usia terbatas. penilaian.
Kami menunjukkan bahwa metode tradisional dapat digantikan dengan estimasi usia berdasarkan model DM dalam praktik estimasi usia forensik di Korea. Kami juga menemukan kemungkinan menerapkan pembelajaran mesin untuk penilaian usia forensik. Namun, ada keterbatasan yang jelas, seperti jumlah peserta yang tidak mencukupi dalam penelitian ini untuk secara definitif menentukan hasilnya, dan kurangnya penelitian sebelumnya untuk membandingkan dan mengkonfirmasi hasil penelitian ini. Di masa depan, studi DM harus dilakukan dengan jumlah sampel yang lebih besar dan populasi yang lebih beragam untuk meningkatkan penerapan praktisnya dibandingkan dengan metode tradisional. Untuk memvalidasi kelayakan menggunakan kecerdasan buatan untuk memperkirakan usia dalam beberapa populasi, studi di masa depan diperlukan untuk membandingkan akurasi klasifikasi dan efisiensi DM dan model pembelajaran mendalam dengan metode tradisional dalam sampel yang sama.
Studi ini menggunakan 2.657 foto ortografis yang dikumpulkan dari orang dewasa Korea dan Jepang berusia 15 hingga 23 tahun. Radiografi Korea dibagi menjadi 900 set pelatihan (19,42 ± 2,65 tahun) dan 900 set uji internal (19,52 ± 2,59 tahun). Set pelatihan dikumpulkan di satu lembaga (Rumah Sakit Seoul St. Mary), dan set tes sendiri dikumpulkan di dua lembaga (Rumah Sakit Gigi Universitas Nasional Seoul dan Rumah Sakit Gigi Universitas Yonsei). Kami juga mengumpulkan 857 radiografi dari data berbasis populasi lainnya (IWATE Medical University, Jepang) untuk pengujian eksternal. Radiografi subjek Jepang (19,31 ± 2,60 tahun) dipilih sebagai set uji eksternal. Data dikumpulkan secara retrospektif untuk menganalisis tahap pengembangan gigi pada radiografi panorama yang diambil selama perawatan gigi. Semua data yang dikumpulkan adalah anonim kecuali untuk jenis kelamin, tanggal lahir dan tanggal radiografi. Kriteria inklusi dan eksklusi sama dengan studi yang diterbitkan sebelumnya 4, 5. Usia sebenarnya sampel dihitung dengan mengurangi tanggal lahir sejak tanggal radiografi diambil. Kelompok sampel dibagi menjadi sembilan kelompok umur. Distribusi usia dan jenis kelamin ditunjukkan pada Tabel 3 penelitian ini dilakukan sesuai dengan Deklarasi Helsinki dan disetujui oleh Institutional Review Board (IRB) dari Rumah Sakit Seoul St. Mary dari Universitas Katolik Korea (KC22WISI0328). Karena desain retrospektif dari penelitian ini, informed consent tidak dapat diperoleh dari semua pasien yang menjalani pemeriksaan radiografi untuk tujuan terapeutik. Seoul Korea University St. Mary's Hospital (IRB) mengesampingkan persyaratan untuk persetujuan.
Tahap perkembangan molar bimaxillary kedua dan ketiga dinilai menurut kriteria demircan25. Hanya satu gigi yang dipilih jika jenis gigi yang sama ditemukan di sisi kiri dan kanan masing -masing rahang. Jika gigi homolog di kedua sisi berada pada tahap perkembangan yang berbeda, gigi dengan tahap perkembangan yang lebih rendah dipilih untuk memperhitungkan ketidakpastian dalam perkiraan usia. Seratus radiografi yang dipilih secara acak dari set pelatihan dinilai oleh dua pengamat yang berpengalaman untuk menguji reliabilitas interobserver setelah prekalibrasi untuk menentukan tahap kematangan gigi. Keandalan intraobserver dinilai dua kali pada interval tiga bulan oleh pengamat primer.
Tahap jenis kelamin dan perkembangan molar kedua dan ketiga dari masing -masing rahang dalam set pelatihan diperkirakan oleh pengamat utama yang dilatih dengan model DM yang berbeda, dan usia aktual ditetapkan sebagai nilai target. Model SLP dan MLP, yang banyak digunakan dalam pembelajaran mesin, diuji terhadap algoritma regresi. Model DM menggabungkan fungsi linier menggunakan tahap perkembangan keempat gigi dan menggabungkan data ini untuk memperkirakan usia. SLP adalah jaringan saraf paling sederhana dan tidak mengandung lapisan tersembunyi. SLP bekerja berdasarkan transmisi ambang antara node. Model SLP dalam regresi secara matematis mirip dengan beberapa regresi linier. Berbeda dengan model SLP, model MLP memiliki beberapa lapisan tersembunyi dengan fungsi aktivasi nonlinier. Eksperimen kami menggunakan lapisan tersembunyi dengan hanya 20 node tersembunyi dengan fungsi aktivasi nonlinier. Gunakan keturunan gradien sebagai metode optimasi dan MAE dan RMSE sebagai fungsi kerugian untuk melatih model pembelajaran mesin kami. Model regresi yang terbaik yang diperoleh diterapkan pada set uji internal dan eksternal dan usia gigi diperkirakan.
Algoritma klasifikasi dikembangkan yang menggunakan kematangan empat gigi pada pelatihan yang ditetapkan untuk memprediksi apakah sampel berusia 18 tahun atau tidak. Untuk membangun model, kami memperoleh tujuh algoritma pembelajaran mesin representasi 6,43: (1) lr, (2) knn, (3) svm, (4) dt, (5) rf, (6) xgboost, dan (7) MLP . LR adalah salah satu algoritma klasifikasi yang paling banyak digunakan44. Ini adalah algoritma pembelajaran yang diawasi yang menggunakan regresi untuk memprediksi probabilitas data yang termasuk dalam kategori tertentu dari 0 ke 1 dan mengklasifikasikan data sebagai milik kategori yang lebih mungkin berdasarkan probabilitas ini; terutama digunakan untuk klasifikasi biner. KNN adalah salah satu algoritma pembelajaran mesin paling sederhana45. Ketika diberikan data input baru, ia menemukan data k dekat dengan set yang ada dan kemudian mengklasifikasikannya ke dalam kelas dengan frekuensi tertinggi. Kami menetapkan 3 untuk jumlah tetangga yang dipertimbangkan (k). SVM adalah algoritma yang memaksimalkan jarak antara dua kelas dengan menggunakan fungsi kernel untuk memperluas ruang linier menjadi ruang non-linear yang disebut Fields46. Untuk model ini, kami menggunakan bias = 1, daya = 1, dan gamma = 1 sebagai hiperparameter untuk kernel polinomial. DT telah diterapkan di berbagai bidang sebagai algoritma untuk membagi seluruh data yang ditetapkan menjadi beberapa subkelompok dengan mewakili aturan keputusan dalam struktur pohon47. Model ini dikonfigurasi dengan jumlah minimum catatan per node 2 dan menggunakan indeks Gini sebagai ukuran kualitas. RF adalah metode ensemble yang menggabungkan beberapa DT untuk meningkatkan kinerja menggunakan metode agregasi bootstrap yang menghasilkan classifier yang lemah untuk setiap sampel dengan menggambar sampel secara acak dengan ukuran yang sama beberapa kali dari dataset asli48. Kami menggunakan 100 pohon, 10 kedalaman pohon, 1 ukuran simpul minimum, dan indeks campuran gini sebagai kriteria pemisahan simpul. Klasifikasi data baru ditentukan oleh suara mayoritas. XGBoost adalah algoritma yang menggabungkan teknik meningkatkan menggunakan metode yang mengambil data pelatihan kesalahan antara nilai aktual dan prediksi dari model sebelumnya dan menambah kesalahan menggunakan gradients49. Ini adalah algoritma yang banyak digunakan karena kinerja dan efisiensi sumber daya yang baik, serta keandalan yang tinggi sebagai fungsi koreksi overfitting. Model ini dilengkapi dengan 400 roda dukungan. MLP adalah jaringan saraf di mana satu atau lebih perceptron membentuk beberapa lapisan dengan satu atau lebih lapisan tersembunyi antara lapisan input dan output38. Menggunakan ini, Anda dapat melakukan klasifikasi non-linear di mana ketika Anda menambahkan lapisan input dan mendapatkan nilai hasil, nilai hasil yang diprediksi dibandingkan dengan nilai hasil aktual dan kesalahan disebarkan kembali. Kami membuat lapisan tersembunyi dengan 20 neuron tersembunyi di setiap lapisan. Setiap model yang kami kembangkan diterapkan pada set internal dan eksternal untuk menguji kinerja klasifikasi dengan menghitung sensitivitas, spesifisitas, PPV, NPV, dan AUROC. Sensitivitas didefinisikan sebagai rasio sampel yang diperkirakan berusia 18 tahun atau lebih dengan sampel yang diperkirakan berusia 18 tahun atau lebih. Spesifisitas adalah proporsi sampel di bawah 18 tahun dan yang diperkirakan berusia di bawah 18 tahun.
Tahapan gigi yang dinilai dalam set pelatihan dikonversi menjadi tahap numerik untuk analisis statistik. Regresi linier dan logistik multivariat dilakukan untuk mengembangkan model prediktif untuk setiap jenis kelamin dan mendapatkan formula regresi yang dapat digunakan untuk memperkirakan usia. Kami menggunakan formula ini untuk memperkirakan usia gigi untuk set uji internal dan eksternal. Tabel 4 menunjukkan model regresi dan klasifikasi yang digunakan dalam penelitian ini.
Keandalan intra dan interobserver dihitung menggunakan statistik Kappa Cohen. Untuk menguji keakuratan DM dan model regresi tradisional, kami menghitung MAE dan RMSE menggunakan perkiraan dan usia aktual set uji internal dan eksternal. Kesalahan ini biasanya digunakan untuk mengevaluasi keakuratan prediksi model. Semakin kecil kesalahan, semakin tinggi keakuratan perkiraan24. Bandingkan MAE dan RMSE set uji internal dan eksternal yang dihitung menggunakan DM dan regresi tradisional. Kinerja klasifikasi dari cutoff 18 tahun dalam statistik tradisional dinilai menggunakan tabel kontingensi 2 × 2. Sensitivitas yang dihitung, spesifisitas, PPV, NPV, dan auroc dari set uji dibandingkan dengan nilai yang diukur dari model klasifikasi DM. Data dinyatakan sebagai rata -rata ± standar deviasi atau angka (%) tergantung pada karakteristik data. Nilai P dua sisi <0,05 dianggap signifikan secara statistik. Semua analisis statistik rutin dilakukan dengan menggunakan SAS Versi 9.4 (SAS Institute, Cary, NC). Model regresi DM diimplementasikan dalam Python menggunakan Keras50 2.2.4 backend dan TensorFlow51 1.8.0 khusus untuk operasi matematika. Model klasifikasi DM diimplementasikan dalam lingkungan Analisis Pengetahuan Waikato dan Platform Analisis Informasi Konstanz (KNIME) 4.6.152.
Para penulis mengakui bahwa data yang mendukung kesimpulan penelitian dapat ditemukan dalam artikel dan bahan tambahan. Dataset yang dihasilkan dan/atau dianalisis selama penelitian tersedia dari penulis yang sesuai berdasarkan permintaan yang wajar.
Ritz-Timme, S. et al. Penilaian Usia: Keadaan seni untuk memenuhi persyaratan spesifik praktik forensik. internasionalitas. J. Kedokteran Hukum. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G., dan Olze, A. Status penilaian usia forensik saat ini dari subjek hidup untuk tujuan penuntutan pidana. Forensik. obat-obatan. Patologi. 1, 239–246 (2005).
Pan, J. et al. Metode yang dimodifikasi untuk menilai usia gigi anak -anak berusia 5 hingga 16 tahun di Cina timur. klinis. Survei Lisan. 25, 3463-3474 (2021).
Lee, SS dll. Kronologi pengembangan molar kedua dan ketiga dalam bahasa Korea dan penerapannya untuk penilaian usia forensik. internasionalitas. J. Kedokteran Hukum. 124, 659-665 (2010).
Oh, S., Kumagai, A., Kim, SY dan Lee, akurasi SS estimasi usia dan estimasi ambang batas 18 tahun berdasarkan kematangan molar kedua dan ketiga di Korea dan Jepang. PLoS One 17, E0271247 (2022).
Kim, JY, dkk. Analisis data berbasis pembelajaran mesin pra operasi dapat memprediksi hasil perawatan operasi tidur pada pasien dengan OSA. sains. Laporan 11, 14911 (2021).
Han, M. et al. Estimasi usia yang akurat dari pembelajaran mesin dengan atau tanpa intervensi manusia? internasionalitas. J. Kedokteran Hukum. 136, 821–831 (2022).
Khan, S. dan Shaheen, M. Dari penambangan data ke penambangan data. J.information. sains. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. dan Shaheen, M. Wisrule: Algoritma kognitif pertama untuk penambangan aturan asosiasi. J.information. sains. https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. dan Abdullah U. Karm: Penambangan data tradisional berdasarkan aturan asosiasi berbasis konteks. menghitung. Matt. melanjutkan. 68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. dan Habib M. Deteksi kesamaan semantik berbasis pembelajaran yang dalam menggunakan data teks. memberitahukan. Teknologi. kontrol. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z., dan Shahin, M. Sistem untuk mengenali aktivitas dalam video olahraga. multimedia. Alat Aplikasi https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS et al. Tantangan Pembelajaran Mesin RSNA dalam Usia Tulang Anak. Radiologi 290, 498–503 (2019).
Li, Y. et al. Estimasi usia forensik dari sinar-X panggul menggunakan pembelajaran mendalam. EURO. radiasi. 29, 2322–2329 (2019).
Guo, YC, dkk. Klasifikasi usia yang akurat menggunakan metode manual dan jaringan saraf konvolusional yang dalam dari gambar proyeksi ortografis. internasionalitas. J. Kedokteran Hukum. 135, 1589–1597 (2021).
Alabama Dalora et al. Estimasi usia tulang menggunakan metode pembelajaran mesin yang berbeda: Tinjauan literatur sistematis dan meta-analisis. PLoS One 14, E0220242 (2019).
Du, H., Li, G., Cheng, K., dan Yang, J. Estimasi usia khusus populasi Afrika-Amerika dan Cina berdasarkan volume ruang pulpa molar pertama menggunakan tomografi terkomputasi balok kerucut. internasionalitas. J. Kedokteran Hukum. 136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK dan OH KS menentukan kelompok umur orang yang hidup menggunakan gambar molar pertama berbasis kecerdasan buatan. sains. Laporan 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N., dan Urschler, M. Estimasi usia otomatis dan klasifikasi usia mayoritas dari data MRI multivariat. IEEE J. Biomed. Peringatan kesehatan. 23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. dan Li, G. Estimasi usia berdasarkan segmentasi ruang pulpa 3D dari molar pertama dari tomografi terkomputasi balok kerucut dengan mengintegrasikan set pembelajaran dan level yang mendalam. internasionalitas. J. Kedokteran Hukum. 135, 365-373 (2021).
Wu, WT, dkk. Penambangan Data dalam Data Besar Klinis: Model Database, Langkah, dan Metode Umum. Dunia. obat-obatan. sumber. 8, 44 (2021).
Yang, J. et al. Pengantar database medis dan teknologi penambangan data di era Big Data. J. Avid. Obat dasar. 13, 57–69 (2020).
Shen, S. et al. Metode Camerer untuk memperkirakan usia gigi menggunakan pembelajaran mesin. BMC Oral Health 21, 641 (2021).
Galliburg A. et al. Perbandingan metode pembelajaran mesin yang berbeda untuk memprediksi usia gigi menggunakan metode pementasan demirdjian. internasionalitas. J. Kedokteran Hukum. 135, 665-675 (2021).
Demirdjian, A., Goldstein, H. dan Tanner, JM Sistem baru untuk menilai usia gigi. mendengus. biologi. 45, 211–227 (1973).
Landis, Jr, dan Koch, GG Ukuran Perjanjian Pengamat tentang Data Kategori. Biometrik 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK dan Choi HK. Analisis tekstur, morfologis dan statistik dari pencitraan resonansi magnetik dua dimensi menggunakan teknik kecerdasan buatan untuk diferensiasi tumor otak primer. Informasi kesehatan. sumber. https://doi.org/10.4258/hir.2022.28.1.46 (2022).


Waktu posting: Jan-04-2024