Informasi

Mengapa tambalan Gabor saya tidak diubah ukurannya sebagai fungsi dari kotak pembatas?

Mengapa tambalan Gabor saya tidak diubah ukurannya sebagai fungsi dari kotak pembatas?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Saya mencoba membuat tambalan Gabor dengan ukuran variabel untuk eksperimen yang akan datang.

Di bawah ini adalah fungsi python yang digunakan untuk menghasilkan kode. Kode dipindahkan dari tutorial ini untuk Matlab (asumsikanimpor numpy sebagai np):

def gabor_patch(size, lambda_, theta, sigma, phase, trim=.005): """Buat Gabor Patch size : int Image size (nxn) lambda_ : int Spatial frequency (px per cycle) theta : int or float Grating orientasi dalam derajat sigma : int atau float deviasi standar gaussian (dalam piksel) fase : float 0 hingga 1 inklusif """ # buat ramp linier X0 = (np.linspace(1, size, size) / size) - .5 # Set panjang gelombang dan frekuensi fasa = ukuran / float(lambda_) fasaRad = fasa * 2 * np.pi # Buat kisi 2D Xm, Ym = np.meshgrid(X0, X0) # Ubah orientasi dengan menambahkan Xm dan Ym bersama-sama dalam proporsi yang berbeda thetaRad = (theta / 360.) * 2 * np.pi Xt = Xm * np.cos(thetaRad) Yt = Ym * np.sin(thetaRad) grating = np.sin(((Xt + Yt) * freq * 2 * np .pi) + phaseRad) # Distribusi Gauss 2D gauss = np.exp(-((Xm ** 2) + (Ym ** 2)) / (2 * (sigma / float(size)) ** 2)) # Pangkas gauss[gauss < trim] = 0 kisi balik * gauss

Saya ingin ukuran tambalan Gabor meningkat secara proporsional denganukuranparameter. Dengan kata lain, saya ingin dimensi kotak pembatas menentukan diameter tambalan. Masalahnya adalah fungsi ini tidak berperilaku seperti ini. Sebaliknya, kotak pembatas bertambah besar sementara tambalan mempertahankan dimensi yang sama.

Contoh 1: ukuran = 100

Contoh 2: ukuran = 500

Sama sekali tidak jelas bagi saya apa yang saya lakukan salah. Bisakah seseorang tolong tunjukkan saya ke arah yang benar?

Tolong beri tahu saya jika saya dapat memberikan informasi lebih lanjut. Terima kasih!


NSukuranparameter dalam kode Anda berarti ukuran tambalan, mis. e. interval dalam x dan y di mana Anda mengambil sampel fungsi Gabor Anda. Apa yang Anda pikirkan adalah mendukung dari fungsi, i. e. interval di mana itu sangat berbeda dari 0. Ini ditentukan olehsigmaparameter, yang merupakan bandwidth dari Gaussian.

Jadi jika Anda hanya meningkatkanukuran, Anda akan mendapatkan kembali gambar yang lebih besar, tetapi area tempat Anda dapat melihat riak akan tetap sama. Jika Anda meningkatkansigma, area dengan riak akan menjadi lebih besar, dan kemudian Anda mungkin harus meningkatkanukuranjuga untuk melihat semuanya.

Omong-omong, IMHO, tempat yang tepat untuk mengajukan pertanyaan ini adalah di dsp.stackexchange.com.


Generasi gambar menengah sangat kaku. image_resize() membuatnya tetap dekat dengan kode dan sama sekali tidak memiliki kait.

Cukup banyak satu-satunya pilihan untuk ini adalah menghubungkan ke wp_generate_attachment_metadata dan menimpa gambar yang dihasilkan WP dengan milik Anda sendiri (yang akan membutuhkan sedikit garpu image_resize()).

Saya membutuhkan ini untuk bekerja sehingga saya mungkin dapat membagikan beberapa kode nanti.

Oke, ini contoh kasar, tetapi berfungsi. Perhatikan bahwa menyiapkan pemotongan dengan cara ini memerlukan pemahaman tentang imagecopyresampled() .

Codex Wordpress memiliki jawabannya, di bawah ini.

Atur ukuran gambar dengan memotong gambar dan menentukan posisi pemotongan:

Saat mengatur posisi pemotongan, nilai pertama dalam larik adalah posisi pemotongan sumbu x, yang kedua adalah posisi pemotongan sumbu y.

x_crop_position menerima 'kiri' 'tengah', atau 'kanan'. y_crop_position menerima 'atas', 'tengah', atau 'bawah'. Secara default, nilai-nilai ini default ke 'tengah' saat menggunakan mode hard crop.


Sistem Pendukung Teleophthalmology Berdasarkan Visibilitas Elemen Retina Menggunakan CNN

Gaya penulisan perlu perbaikan substansial untuk membuatnya lebih struktural. Diperlukan pemeriksaan menyeluruh dari bahasa Inggris. Jumlah kesalahan tata bahasa yang ada (terlalu banyak kesalahan untuk dicantumkan semuanya di sini). Banyak, kalimat yang terlalu panjang membuat pembacaan menjadi sulit. Beberapa typo juga.

Tidak jelas mengapa penting untuk membagi organ yang berbeda (OD, pembuluh darah, &hellip).

Posisi pandangan yang benar juga harus diperiksa. Para dokter mata menggunakan untuk mengambil pandangan hidung, tengah atau lateral.

Beberapa pilihan arsitektur tampak aneh dan harus dibenarkan. Misalnya, tentang OD. Anda melatih VGG16 dari awal untuk mendeteksi OD tetapi menggunakan pembelajaran transfer untuk estimasi kualitas. Kenapa begitu? Juga, VGG16 adalah model yang sangat besar, perasaan saya mungkin terlalu besar untuk tugas itu. Dalam konteks oftalmoskop portabel, model yang lebih kecil (seperti SSD MobileNet) akan lebih relevan untuk deteksi objek. SSD MobileNet memiliki

Parameter 1M sedangkan VGG16 lebih dari 15M.

Anda akan mendapatkan waktu pemrosesan yang lebih singkat dengan jaringan yang lebih kecil. Yang memang tampaknya juga menjadi salah satu perhatian Anda. Waktu berjalan yang singkat penting bagi pasien untuk menghindari pengambilan foto tambahan jika sudah memiliki kualitas yang memadai. Anda tentu tidak ingin membiarkan pasien menunggu terlalu lama setelah setiap foto.

Bagaimana kualitas gambar terbaik secara keseluruhan dipilih berdasarkan beberapa kriteria kualitas parsial? Menurut Gambar 2, menurut pemahaman saya, ini adalah jumlah atau urutan dari beberapa pemeriksaan/kegagalan QL biner. Jika semua QL OK, maka gambar diterima dan akuisisi berhenti. Jika tidak, paling banyak 5 foto yang diambil. Bagaimana Anda memilih yang terbaik? Bagaimana Anda membuktikan pilihan itu?

Apresiasi keseluruhan : karya ini terdiri dari beberapa aplikasi dari berbagai CNN untuk melakukan tugas tertentu.

Evaluasi? Saya memiliki keraguan tentang evaluasi. Anda mengklaim menggunakan sensitivitas, spesifisitas dan akurasi. Tetapi tindakan apa yang Anda gunakan untuk berbagai tugas ini, seperti OD, segmentasi kapal, estimasi kualitas? Sifat yang berbeda dari tugas-tugas ini mungkin memerlukan penggunaan ukuran yang berbeda: DICE, jaccard, &hellip dll.

Mengenai perbandingan dengan yang ada, sensitivitas referensi [25] pada Tabel 3 tampaknya sangat buruk, jauh di bawah apa yang dilaporkan dalam makalah mereka dan pada kumpulan data publik. Apakah Anda sendiri yang menerapkannya? Apakah Anda adil dengan implementasinya? Waktu yang dilaporkan juga aneh.

Perbandingan dengan hasil dalam literatur harus diperluas. Literatur berlimpah tentang hal ini.

Tepatnya apa yang dimaksud dengan « ahli » dan « dokter umum ».

Saran: bisakah Anda membuat gambar lebih terang dan lebih besar untuk keperluan pencetakan?

Gaya penulisan perlu perbaikan substansial untuk membuatnya lebih struktural. Diperlukan pemeriksaan menyeluruh dari bahasa Inggris. Jumlah kesalahan tata bahasa yang ada (terlalu banyak kesalahan untuk dicantumkan semuanya di sini). Banyak, kalimat yang terlalu panjang membuat pembacaan menjadi sulit. Beberapa typo juga.

Terima kasih telah meninjau makalah kami dan kami mohon maaf atas banyak kesalahan bahasa Inggris di makalah ini. Kami dengan hati-hati merevisi makalah dan mengoreksi kesalahan tata bahasa dan kesalahan ketik. Kami berharap bahwa versi revisi telah ditingkatkan sesuai dengan persyaratan Jurnal.

Terima kasih atas pertanyaan Anda. Mengenai pertanyaan Anda, kami memberikan tanggapan berikut, dari sudut pandang dokter mata. Dalam versi revisi, kami menambahkan deskripsi singkat untuk memperjelas masalah ini.

Retina adalah satu-satunya organ yang dapat dinilai melalui kamera tanpa memerlukan prosedur invasif. Untuk mendapatkan evaluasi yang komprehensif, dokter mata perlu membatasi landmark paling penting untuk retina, yaitu pembuluh darah dan saraf optik yang dapat diamati di dalam OD. Visibilitas yang baik dari elemen-elemen tersebut sangat penting untuk mendeteksi atau mendiagnosis sejumlah besar penyakit mata. Misalnya, visibilitas yang baik dari saraf optik sangat penting dalam mendeteksi glaukoma atau penyakit neuro-oftalmologi atau vaskular lainnya. Salah satu penyakit mata yang paling umum adalah retinopati diabetik, penyakit yang dimulai pada pembuluh retina yang menyoroti pentingnya segmentasi juga. Akhirnya, segmentasi pembuluh darah dan saraf optik, memungkinkan kita untuk menggambarkan area retina seperti makula yang merupakan area antara arcade vaskular temporal dan bagian terpenting dari retina di mana penglihatan membaca berada dan di mana banyak penyakit mata. Mulailah. Kami menambahkan satu kalimat (baris 91-94) yang terkait dengannya dalam versi revisi.

  1. Posisi pandangan yang benar juga harus diperiksa. Dokter mata menggunakan untuk mengambil pandangan hidung, tengah atau lateral.

Terima kasih atas pengamatan Anda. Jika kita menggunakan kamera fundus umum dengan FOV 45° untuk memperoleh gambar retina, diperlukan untuk mengambil beberapa gambar (tampak hidung, tengah dan lateral) untuk memiliki komposisi gambar retina. Namun, itu tidak diperlukan dalam penelitian kami karena kami menggunakan pemindaian laser oftalmoskop (SLO) sebagai perangkat utama kami untuk menangkap gambar. SLO ini memungkinkan kita mendapatkan gambar retina ultra-widefield ini berarti bahwa dengan kualitas gambar yang baik kita dapat memperoleh informasi sekitar 200&derajat retina berbeda dengan model lain yang mendapatkan 30&derajat hingga 45&derajat. Karakteristik ini memungkinkan kita menghilangkan kebutuhan pasien untuk memutar kepala ke arah yang berbeda untuk mendapatkan komposisi gambar. Dalam lingkungan teleophthalmology, 200° sentral adalah yang paling berharga, jika dicurigai ada patologi di perifer, pasien harus selalu pergi ke spesialis. Dalam versi revisi, deskripsi SLO yang disebutkan di atas ditambahkan untuk memperjelas masalah ini. Kami menambahkan satu kalimat (baris 47-48) dalam versi revisi.

    Beberapa pilihan arsitektur tampak aneh dan harus dibenarkan. Misalnya, tentang OD. Anda melatih VGG16 dari awal untuk mendeteksi OD tetapi menggunakan pembelajaran transfer untuk estimasi kualitas. Kenapa begitu? Juga, VGG16 adalah model yang sangat besar, perasaan saya mungkin terlalu besar untuk tugas itu. Dalam konteks oftalmoskop portabel, model yang lebih kecil (seperti SSD MobileNet) akan lebih relevan untuk deteksi objek. SSD MobileNet memiliki

Terima kasih atas komentar Anda tentang pemilihan model CNN. Untuk pemilihannya, kami merujuk makalah berikut:

2017. Huang dkk. &ldquoPertukaran kecepatan/akurasi untuk detektor objek konvolusi modern&rdquo, IEEE Conf. tentang Visi Komputer dan Pengenalan Pola, 2017.

Dalam makalah ini, penulis menunjukkan bahwa Faster-RCNN dengan VGG16 memberikan akurasi yang lebih baik dibandingkan dengan SSD MobileNet, ketika objek yang diinginkan kecil. Dalam kasus kami, gambar retina memiliki 3900 x 3072 piksel, sedangkan ukuran OD sekitar 165x165 piksel, yang berarti bahwa OD, objek yang kami minati, sangat kecil, hanya menempati 0,2% di seluruh gambar. Jadi, kami memilih Faster-RCNN dengan VGG16 sesuai dengan saran dari makalah Huang. Dalam versi revisi, kami menambahkan justifikasi pilihan CNN pada baris 197-203.

Tentang komentar Anda &ldquoAnda melatih VGG16 dari awal untuk mendeteksi OD tetapi menggunakan pembelajaran transfer untuk estimasi kualitas.&rdquo, kami menggunakan pembelajaran transfer dalam kedua kasus (deteksi OD dan penilaian kualitas). Dalam versi revisi, kami menambahkan baris 221.

Tentang komentar Anda &ldquoJuga, VGG16 adalah model yang sangat besar, perasaan saya bahkan mungkin terlalu besar untuk tugas itu. Dalam konteks oftalmoskop portabel, model yang lebih kecil (seperti SSD MobileNet) akan lebih relevan untuk deteksi objek. SSD MobileNet memiliki

Parameter 1M sedangkan VGG16 lebih dari 15M.&rdquo

Kami menyetujui komentar Anda untuk oftalmoskop portabel. Namun, kami tidak mempertimbangkan oftalmoskop portabel. Sistem pendukung teleophthalmology yang diusulkan dianggap sebagai bagian dari proyek teleophthalmology kami, di mana perhitungan akan dilakukan di lingkungan cloud. Dalam hal ini, ruang memori bukanlah kebutuhan utama, meskipun kami menganggap bahwa MobileNet dapat menjadi alternatif yang baik. SLO yang kami gunakan untuk menangkap gambar tidak portabel, sehingga SLO harus dalam posisi tetap, meskipun sistem yang diusulkan digunakan di klinik keliling. Dalam versi revisi, kami menambahkan baris 560-563 untuk menjelaskan secara singkat masalah yang disebutkan di atas.

Dalam versi makalah sebelumnya, kami tidak menyebutkan tentang proyek masa depan kami dan alasan utama pemilihan model CNN. Dalam versi revisi, kami membenarkan pemilihan model CNN.

  1. Anda akan mendapatkan waktu pemrosesan yang lebih singkat dengan jaringan yang lebih kecil. Yang memang tampaknya juga menjadi salah satu perhatian Anda. Waktu berjalan yang singkat penting bagi pasien untuk menghindari pengambilan foto tambahan jika sudah memiliki kualitas yang memadai. Anda tentu tidak ingin membiarkan pasien menunggu terlalu lama setelah setiap foto.

Terima kasih atas komentar Anda yang bermanfaat. Kami sepakat bahwa waktu eksekusi harus cukup singkat. Waktu berlalunya sistem yang diusulkan menentukan bahwa satu gambar retina berkualitas tinggi, kira-kira 11,3 detik dari pengambilan foto. Kali ini rata-rata diperoleh dengan menggunakan 10 gambar berkualitas tinggi. Kami berharap waktu eksekusi dapat dikurangi lebih lanjut di lingkungan cloud. Dalam versi makalah yang direvisi, kami menambahkan waktu berlalu rata-rata dalam tingkat kualitas yang berbeda pada tabel 10 (baris 516) dan deskripsi singkat pada baris 515-519.

  1. Bagaimana kualitas gambar terbaik secara keseluruhan dipilih berdasarkan beberapa kriteria kualitas parsial? Menurut Gambar 2, menurut pemahaman saya, ini adalah jumlah atau urutan dari beberapa pemeriksaan/kegagalan QL biner. Jika semua QL OK, maka gambar diterima dan akuisisi berhenti. Jika tidak, paling banyak 5 foto yang diambil. Bagaimana Anda memilih yang terbaik? Bagaimana Anda membuktikan pilihan itu?

Gambar retina harus melewati tiga pemeriksaan biner: deteksi OD sebagai pemeriksaan pertama, kualitas OD sebagai pemeriksaan kedua, dan keberadaan artefak di ROI sebagai pemeriksaan ketiga. Gambar retina yang melewati tiga pemeriksaan biner ini dianggap sebagai gambar berkualitas baik. Seperti yang Anda sebutkan: &ldquoJika semua QL OK, maka gambar diterima dan akuisisi berhenti&rdquo, sehingga dalam kasus terbaik hanya satu foto yang diambil. Di sisi lain, dalam kasus terburuk, di mana 5 foto harus diambil, foto dengan nilai QL yang lebih besar dipilih sebagai gambar dengan kualitas lebih baik di antara foto-foto tersebut. Jika ada beberapa foto dengan tingkat kualitas (QL) yang sama, yang terakhir dipilih sebagai yang lebih baik. Terima kasih atas komentar Anda, dalam versi revisi makalah, kami menjelaskan lebih baik proses sistem yang diusulkan (baris 186-189)

  1. Evaluasi : Saya ragu dengan evaluasinya. Anda mengklaim menggunakan sensitivitas, spesifisitas dan akurasi. Tetapi tindakan apa yang Anda gunakan untuk berbagai tugas ini, seperti OD, segmentasi kapal, estimasi kualitas? Sifat yang berbeda dari tugas-tugas ini mungkin memerlukan penggunaan ukuran yang berbeda: DICE, jaccard, &hellip dll.

Terima kasih atas saran Anda yang berharga. Kami memperkenalkan metrik DICE dan jaccard untuk mengevaluasi metode segmentasi kapal kami dalam versi yang direvisi. Pada tabel 6, kami menambahkan nilai dari dua metrik ini. Kami merevisi beberapa metode segmentasi kapal dalam literatur, namun kami tidak dapat menemukan metode apa pun yang menggunakan dua metrik ini (DICE dan jaccard) atau salah satunya untuk evaluasi kinerja. Metrik ini biasanya digunakan untuk segmentasi penyakit mata, seperti eksudat keras. Kami menemukan makalah baru-baru ini, di mana penulis menggunakan fungsi kerugian DICE alih-alih fungsi kerugian umum, seperti cross-entropy, di CNN U-net, namun mereka melaporkan akurasi, kepekaan, dan spesifisitas kinerja mereka. Dalam versi revisi, kami menambahkan baris 432-434 untuk nilai metrik DICE dan Jaccard, dan kinerja &ldquoU-net dengan fungsi rugi DICE&rdquo pada tabel 7 untuk tujuan perbandingan.

  1. Mengenai perbandingan dengan yang ada, sensitivitas referensi [25] pada Tabel 3 tampaknya sangat buruk, jauh di bawah apa yang dilaporkan dalam makalah mereka dan pada kumpulan data publik. Apakah Anda sendiri yang menerapkannya? Apakah Anda adil dengan implementasinya? Waktu yang dilaporkan juga aneh.

Hasil dari ref. [25] pada Tabel 3 diperoleh oleh kami, karena metode deteksi OD apa pun untuk gambar yang diambil dengan ultrawide-FOV SLO belum dilaporkan dalam literatur. Kami mengevaluasi kinerja deteksi OD menggunakan database kami sendiri dan DRIMBD, yang hanya merupakan database publik untuk kualitas gambar retina. Kedua database berisi banyak gambar berkualitas rendah. Dalam metode [25], template histogram dari wilayah OD dibangun, dan histogram dari semua blok dibandingkan dengan template untuk memilih satu blok dengan kesamaan tertinggi sebagai OD. Metode ini bekerja dengan baik jika hampir semua gambar dari kumpulan data berkualitas baik, namun kinerjanya menurun ketika kumpulan data berisi beberapa gambar berkualitas rendah, tidak mendeteksi wilayah OD sebagai OD. Mengenai running time [25], metode menghitung histogram setiap blok dan jumlah blok sebanding dengan jumlah piksel, kemudian running time juga sebanding dengan ukuran citra. Ukuran gambar dari kumpulan data kita sendiri (3900 x 3072) jauh lebih besar daripada kumpulan data publik (misalnya, 565 x 584 dalam DRIVE). Kami menganggap bahwa ini adalah alasan waktu berjalan yang berlebihan dari metode ini untuk gambar kami sendiri. Dalam versi revisi, kami menambahkan analisis kami di baris 374-378.

  1. Perbandingan dengan hasil dalam literatur harus diperluas. Literatur berlimpah tentang hal ini.

Terima kasih atas saranmu. Kami setuju bahwa ada banyak metode penilaian kualitas retina dalam literatur. Namun, kami tidak dapat menemukan sistem apa pun dalam literatur dengan tujuan serupa dari sistem yang diusulkan, sehingga sulit untuk menunjukkan perbandingan yang berarti karena alasan yang disebutkan di bawah ini:

Kontribusi utama dari sistem pendukung teleophthalmology yang diusulkan adalah:

  • Berikan informasi yang cukup kepada operator SLO jika citra retina yang diambil berkualitas rendah untuk diagnosis yang andal. Dengan cara ini, operator dapat mengambil gambar dengan kualitas lebih baik untuk dikirim ke rumah sakit pusat.
  • Rumah sakit pusat tidak hanya menerima gambar dengan kualitas terbaik, tetapi juga menerima beberapa gambar tambahan, seperti gambar OD, gambar pembuluh biner dan gambar ROI, bersama dengan laporan yang dihasilkan oleh sistem. Dengan menggunakan semua informasi tentang gambar retina, dokter mata dapat melakukan diagnosa yang dapat diandalkan di bawah ketidakhadiran pasien.

Bahkan dalam literatur telah dilaporkan beberapa sistem yang efisien untuk penilaian kualitas gambar, salah satunya memberikan kepada dokter mata semua informasi yang diperlukan untuk diagnostik yang andal saat pasien tidak ada.

Dalam versi revisi, kami menambahkan beberapa deskripsi terkait masalah ini di baris 91-94 dan baris 560-563.

Kami menggunakan istilah &ldquoPakar&rdquo sebagai dokter mata yang belajar lebih dari 3 tahun di rumah sakit mata setelah lulus dari fakultas kedokteran, sedangkan kami menggunakan istilah &ldquodokter umum&rdquo sebagai dokter yang lulus dari fakultas kedokteran, tetapi belum menyelesaikan spesialisasi oftalmologi.Para ahli mengevaluasi beberapa gambar retina sebagai pekerjaan sehari-harinya. Dalam versi revisi, kami menetapkan istilah-istilah ini di baris 461-464. Terima kasih atas komentarmu.

Saran: bisakah Anda membuat gambar lebih terang dan lebih besar untuk keperluan pencetakan?

Terima kasih atas saranmu. Mengikuti saran Anda, kami meningkatkan kualitas gambar 2, 3 dan 10 untuk tujuan pencetakan dalam versi revisi.

Naskah ini menyajikan sistem untuk mengawasi dan membantu meningkatkan akuisisi citra di teleophthalmology. Juga tujuannya adalah untuk memberikan segmentasi dan analisis elemen anatomi utama retina. Kebaruan makalah ini terbatas karena semua jaringan saraf convolutional yang digunakan dalam makalah sudah terkenal. Deteksi cakram optik, penilaian kualitas dan segmentasi pembuluh darah juga sangat umum dalam literatur. Kontribusi utama adalah bahwa, dalam kasus akuisisi gambar berkualitas rendah, sistem memberikan kemungkinan alasan yang menyebabkannya, sehingga operator dapat memperbaiki masalah dengan bidikan baru sebelum mengirim laporan ke rumah sakit.

Makalah ini terstruktur dengan baik tetapi bahasa Inggris harus sangat ditingkatkan. Ada banyak kesalahan mengenai tata bahasa/gaya penulisan. Saya pikir manuskrip harus melalui tinjauan ekstensif. Dari sudut pandang cara naskah saat ini disajikan, itu tidak dapat diterima.

Dari sudut pandang kesehatan ilmiah naskah, mungkin dapat diterima. Kelemahan utama adalah kurangnya orisinalitas dalam algoritma yang digunakan. Bahkan Jaringan Saraf Konvolusional Berbasis Wilayah Cepat yang lebih spesifik yang diterapkan untuk mendeteksi cakram optik sudah disajikan di makalah

  1. Sadhukhan, G. K. Ghorai, S. Maiti, G. Sarkar dan A. K. Dhara, "Lokalisasi Disk Optik pada Gambar Retina Fundus menggunakan R-CNN Lebih Cepat," Konferensi Internasional Kelima 2018 tentang Emerging Applications of Information Technology (EAIT), Kolkata, 2018, hlm. 1-4. Makalah ini tidak disebutkan dalam naskah.

Kekuatan kertas adalah tingginya jumlah gambar yang digunakan untuk mengembangkan dan melatih sistem. Juga akurasi yang dicapai. Mengenai kekuatan pertama, akan sangat menarik, dan kontribusi yang besar, jika dataset tersedia untuk komunitas ilmiah. Ada beberapa kumpulan data gambar mata dan fundus seperti DRIMBD, MESSIDOR, dll., tetapi yang besar dengan Optos SLO dengan lokalisasi disk optik manual yang dianotasi akan sangat dihargai. Mengenai kekuatan kedua, akan lebih mudah bahwa sistem dapat diuji secara online, melalui halaman web atau serupa, di mana gambar acak dari kumpulan data dapat dicoba atau gambar pihak ketiga dapat diunggah dan diproses.

Koreksi dan saran tambahan ada di bawah.

Untuk menghasilkan dataset pelatihan, kotak pembatas diberi label secara manual di setiap gambar pelatihan dari dataset, seperti yang ditunjukkan pada Gambar .

Berapa ukuran kotak pembatas?

Jika Pr(??) > ?h?? maka kotak pembatas yang terdeteksi dianggap sebagai wilayah OD.

Apakah semua 12880 gambar dengan lokalisasi disk optik diberi label secara manual? Jika demikian, akan sangat dihargai jika upaya besar seperti itu diumumkan kepada publik, seperti yang disebutkan di atas.

Tautan tidak mencapai informasi yang disebutkan. Di sana, ada banyak komite.

Dibutuhkan link yang lebih tepat.

Menghadapi rumus (1)-(8) pada Gambar 7, terlihat bahwa X dalam rumus bersesuaian dengan dimensi vertikal dan Y dengan dimensi horizontal. Ini tidak umum. Saya pikir cara ini dipilih, itu harus dikatakan dalam teks dan/atau secara eksplisit ditunjukkan pada gambar.

Tidak cukup jelas bagaimana tambalan diperoleh dari gambar.

Apakah teknik superpiksel diterapkan pada seluruh gambar atau pada ROI. Apakah ini menggunakan resolusi penuh atau versi 224x224x3 yang di-downsampling? Apakah downsampling merupakan langkah terakhir, diterapkan setelah superpixel, dan croping ROI?

Apa alasan untuk mencoba vgg16 dan MobileNet untuk segmentasi kapal daripada vgg16 dan Alexnet seperti yang digunakan dalam analisis obstruksi?

baris: 436 kalimatnya tidak selesai

Dalam eksperimen ini, dua dokter mata ahli yang bekerja di bagian retina rumah sakit mata dan lima dokter umum yang bekerja di rumah sakit mata yang sama sebagai relawan bakti sosial.

Saya pikir Gambar 16 tidak diperlukan. Lebih kurang kontribusinya dapat dilihat pada Gambar 17.

masukan gambar retina yang diambil oleh oftalmoskop non-midriatik, seperti Scanning Lases Ophthalmoscopes (SLO)

menurut -- menurut

Kami mengevaluasi kinerja setiap proses --

Kami mengevaluasi kinerja setiap proses

  1. Naskah ini menyajikan sistem untuk mengawasi dan membantu meningkatkan akuisisi citra di teleophthalmology. Juga tujuannya adalah untuk memberikan segmentasi dan analisis elemen anatomi utama retina. Kebaruan makalah ini terbatas karena semua jaringan saraf convolutional yang digunakan dalam makalah sudah terkenal. Deteksi cakram optik, penilaian kualitas dan segmentasi pembuluh darah juga sangat umum dalam literatur. Kontribusi utama adalah bahwa, dalam kasus akuisisi gambar berkualitas rendah, sistem memberikan kemungkinan alasan yang menyebabkannya, sehingga operator dapat memperbaiki masalah dengan bidikan baru sebelum mengirim laporan ke rumah sakit.

Tanggapan: Terima kasih telah meringkas makalah kami dan tujuan utama penelitian kami.

  1. Makalah ini terstruktur dengan baik tetapi bahasa Inggris harus sangat ditingkatkan. Ada banyak kesalahan mengenai tata bahasa/gaya penulisan. Saya pikir manuskrip harus melalui tinjauan ekstensif. Dari sudut pandang cara naskah saat ini disajikan, itu tidak dapat diterima.

Tanggapan: Kami mohon maaf atas banyak kesalahan bahasa Inggris dan kesalahan ketik dalam makalah kami. Kami merevisi makalah kami dengan hati-hati. Dalam versi makalah yang direvisi, kami memperbaiki semua kesalahan ketik dan kesalahan tata bahasa.

  1. Dari sudut pandang kesehatan ilmiah naskah, mungkin dapat diterima. Kelemahan utama adalah kurangnya orisinalitas dalam algoritma yang digunakan. Bahkan Jaringan Saraf Konvolusional Berbasis Wilayah Cepat yang lebih spesifik yang diterapkan untuk mendeteksi cakram optik sudah disajikan di makalah

Sadhukhan, G. K. Ghorai, S. Maiti, G. Sarkar dan A. K. Dhara, "Lokalisasi Disk Optik pada Gambar Retina Fundus menggunakan R-CNN Lebih Cepat," Konferensi Internasional Kelima 2018 tentang Emerging Applications of Information Technology (EAIT), Kolkata, 2018, hlm. 1-4. Makalah ini tidak disebutkan dalam naskah.

Tanggapan: Kami setuju dengan pendapat Anda, CNN yang kami gunakan dalam sistem yang diusulkan sebelumnya diusulkan untuk tujuan lain. Metode lokalisasi OD diusulkan oleh Sadnukhan et al. menggunakan arsitektur jaringan CIFAR-10 di bagian ekstraksi fitur Faster R-CNN. Ukuran citra masukan CNN CIFRA-10 harus 32 x 32. Jadi, arsitektur ini cocok untuk objek kepentingan yang berukuran relatif kecil (wilayah OD), karena setelah mengubah ukuran wilayah OD menjadi 32x32 piksel untuk menjadi masukan CIFRA -10 CNN, OD mempertahankan karakteristiknya. Namun, arsitektur ini tidak berkinerja baik untuk gambar berukuran besar (misalnya 3900 x 3072 piksel sebagai gambar SLO), karena pada gambar SLO, wilayah OD kira-kira 168 x 168 piksel, maka OD harus diubah ukurannya dan setelah mengubah ukuran dalam 32x32 karakteristik yang relevan OD mungkin hilang.

  1. Kekuatan kertas adalah tingginya jumlah gambar yang digunakan untuk mengembangkan dan melatih sistem. Juga akurasi yang dicapai. Mengenai kekuatan pertama, akan sangat menarik, dan kontribusi yang besar, jika dataset tersedia untuk komunitas ilmiah. Ada beberapa kumpulan data gambar mata dan fundus seperti DRIMBD, MESSIDOR, dll., tetapi yang besar dengan Optos SLO dengan lokalisasi disk optik manual yang dianotasi akan sangat dihargai. Mengenai kekuatan kedua, akan lebih mudah jika sistem dapat diuji secara online, melalui halaman web atau serupa, di mana gambar acak dari kumpulan data dapat dicoba, atau gambar pihak ketiga dapat diunggah dan diproses.

Tanggapan: Terima kasih atas komentar Anda yang bermanfaat. Mengenai kumpulan data yang tersedia untuk komunitas ilmiah, kami sepenuhnya menyetujui proposal Anda. Kami akan mengatur semua gambar dengan Ground Truth (GT) dan, kami akan membintangi proses yang ditentukan untuk mempublikasikan dataset kami. Mengenai sistem yang diusulkan dapat diuji secara online, kami memiliki rencana untuk menginstal sistem yang diusulkan di lingkungan komputasi awan untuk diuji secara bebas oleh komunitas ilmiah.

Koreksi dan saran tambahan ada di bawah.

baris 203: Untuk menghasilkan dataset pelatihan, kotak pembatas diberi label secara manual di setiap gambar pelatihan dari dataset, seperti yang ditunjukkan pada Gambar .

Berapa ukuran kotak pembatas?

Tanggapan: Ukuran kotak pembatas bervariasi tergantung pada gambar. Tinggi dan lebar rata-rata masing-masing adalah 167,85 dan 169,91 piksel. Varian tinggi dan lebar masing-masing adalah 23,94 dan 26,09 piksel. Dalam versi revisi, kami menambahkan ukuran kotak pembatas pada baris 214-218.

baris 200: Jika Pr(??) > ?h?? maka kotak pembatas yang terdeteksi dianggap sebagai wilayah OD.

Apakah semua 12880 gambar dengan lokalisasi disk optik diberi label secara manual? Jika demikian, akan sangat dihargai jika upaya besar seperti itu diumumkan kepada publik, seperti yang disebutkan di atas.

Tanggapan: Ukuran database asli kami adalah 1288. Kami menerapkan teknik augmentasi data untuk setiap gambar untuk mendapatkan total 12880 gambar. Setelah augmentasi data, kami secara manual membatasi kotak pembatas untuk masing-masing 12880 gambar menggunakan alat Pelabelan Matlab. Dalam versi revisi kami menyebutkan nomor gambar asli pada baris 136 dan 216.

baris 236: Tautan tidak mencapai informasi yang disebutkan. Di sana, ada banyak komite.https://www.gov.uk/government/groups/uk-national-screening-comite-uk-nsc. Dibutuhkan link yang lebih tepat.

Tanggapan: Kami mohon maaf atas ketidaktepatan ini. Judul dokumennya adalah &ldquoUK KOMITE PEMERIKSAAN NASIONAL Elemen Penting dalam Mengembangkan Program Skrining Retinopati Diabetik&rdquo dan tautannya adalah sebagai berikut.

Halaman 76-78 dokumen menyebutkan tentang visibilitas wilayah termasuk makula, DO dan pembuluh darah untuk skrining DR. Dalam versi revisi makalah, kami mengoreksi referensi [24].

baris 246: Menghadapi rumus (1)-(8) ke Gambar 7, tampaknya X dalam rumus sesuai dengan dimensi vertikal dan Y dengan dimensi horizontal. Ini tidak umum. Saya pikir cara ini dipilih, itu harus dikatakan dalam teks dan/atau secara eksplisit ditunjukkan pada gambar.

Tanggapan: Terima kasih atas saran Anda. Untuk memudahkan pemahaman, dalam versi revisi kami memodifikasi persamaan (1)-(8) dan Gambar 7 menurut cara yang umum: X adalah indeks kolom dan Y adalah indeks baris.

baris 284: Tidak cukup jelas bagaimana tambalan diperoleh dari gambar.

Tanggapan: Kami memperoleh 100 tambalan secara acak dari masing-masing dari 10 gambar dengan artefak (bulu mata dan kelopak mata). Kemudian teknik augmentasi data diterapkan pada 100 tambalan ini untuk meningkatkan secara artifisial menjadi 500 tambalan per gambar. Secara total, kami membuat 5000 patch untuk melatih SegNet. 80% dari total 5000 patch digunakan dalam proses pelatihan dan 20% sisanya digunakan untuk pengujian. Dalam versi makalah yang direvisi, kami memodifikasi deskripsi untuk memperjelas cara mendapatkan tambalan di baris 296-299.

Apakah teknik superpiksel diterapkan pada seluruh gambar atau pada ROI. Apakah menggunakan resolusi penuh atau versi 224x224x3 downsampled? Apakah downsampling merupakan langkah terakhir, diterapkan setelah superpixel, dan croping ROI?

Tanggapan: Ya, kami menerapkan teknik piksel super ke seluruh gambar dengan resolusi penuh. Kami menetapkan jumlah piksel super menjadi 1000 untuk seluruh gambar. Tujuan penggunaan super-piksel adalah konstruksi yang efektif dari Ground Truth dari piksel artefak, seperti bulu mata dan kelopak mata. Teknik super-piksel memungkinkan kami menghasilkan Ground Truth (GT) artefak (bulu mata dan kelopak mata) lebih mudah dan lebih efektif. Setelah gambar GT biner dibangun, mereka digunakan untuk melatih SegNet CNN. Seperti disebutkan di atas, teknik augmentasi data yang sama diterapkan pada patch GT yang sesuai untuk menghasilkan patch 5000 GT. Dalam versi makalah yang direvisi, kami memperkuat deskripsi untuk memperjelas penggunaan teknik piksel super pada baris 273-275 dan baris 280-281.

baris 372: diajukan -- diusulkan

baris 374: belajar & belajar ndash

Tanggapan: Kami mohon maaf atas kesalahan ini. Kami memperbaiki kesalahan ini dan meninjau dengan cermat untuk menghindari kesalahan ketik.

baris 402: Apa alasan untuk mencoba vgg16 dan MobileNet untuk segmentasi kapal daripada vgg16 dan Alexnet seperti yang digunakan dalam analisis obstruksi?

Tanggapan: Kami membuktikan SegNet dengan vgg16 dan MobileNet untuk tugas segmentasi pembuluh darah, dan SegNet dengan vgg16 untuk deteksi artefak (bulu mata dan kelopak mata). Karena SegNet dengan vgg16 memberikan segmentasi yang lebih presisi. Kami meninjau redaksi makalah kami untuk mengklarifikasi bahwa Alexnet tidak digunakan dalam tugas-tugas ini.

baris 433: andal & ndash andal

Tanggapan: Kami mohon maaf atas kesalahan ini. Kami memperbaiki kesalahan dan merevisi kertas dengan hati-hati.

baris: 436 kalimatnya tidak selesai

Dalam percobaan ini, dua dokter mata ahli yang bekerja di departemen retina rumah sakit mata lebih dari tiga tahun dan lima dokter umum yang bekerja di rumah sakit mata yang sama sebagai relawan layanan sosial berpartisipasi dalam proses evaluasi.

Tanggapan: Kami mohon maaf atas kalimat yang tidak lengkap. Kami mengoreksi kalimat ini pada baris 458-461 dalam versi revisi.

baris 438: evaluasi -- evaluasi

baris 442: terdistorsi -- terdistorsi

baris 447, Tabel 8 deviasi & ndash deviasi

baris 482: Saya pikir Gambar 16 tidak diperlukan. Lebih kurang kontribusinya dapat dilihat pada Gambar 17.

Tanggapan: Terima kasih atas saran Anda. Kami menghilangkan Gambar 16 dari versi revisi makalah.

masukan gambar retina yang diambil oleh oftalmoskop non-midriatik, seperti Scanning Lases Ophthalmoscopes (SLO)

baris 504 menurut -- menurut

baris 505 Kami mengevaluasi kinerja setiap proses --

Kami mengevaluasi kinerja setiap proses

Tanggapan: Kami mohon maaf atas kesalahan ini. Kami mengoreksi kesalahan dan dengan hati-hati merevisi versi makalah yang direvisi.

Semuanya telah ditinjau dan baik-baik saja, tetapi dataset dengan kebenaran dasar belum dipublikasikan atau situs web dengan sistem.

Terima kasih telah meninjau makalah kami.

Butir 1: Semuanya telah ditinjau dan baik-baik saja, tetapi dataset dengan ground-truth belum dipublikasikan atau situs web dengan sistem.

Tanggapan: Sehubungan dengan pertanyaan Anda, kumpulan data dan sistem akan dipublikasikan setelah didaftarkan di kantor kekayaan intelektual Meksiko. Sayangnya, karena pandemi, semua kantor pemerintah Meksiko ditutup. Setelah pendaftaran diperoleh, database akan tersedia untuk komunitas riset tanpa biaya.


Saya menemukan bahwa --verbose flag akan menampilkan kotak pembatas yang digunakan pada setiap langkah. Karena ini adalah animasi "berkembang", halaman terakhir adalah yang terbesar.

Jadi untuk mendapatkan semuanya dengan ukuran yang sama, saya menjalankan pdfcrop dengan --verbose dan mengekstrak hasil ini:

dan kemudian memasukkannya ke menjalankan pdfcrop kedua, menentukan kotak pembatas:

Jika halaman terakhir bukan yang terbesar, kita perlu menghitung lebar dan tinggi maksimum di antara semua halaman, dan kemudian menggunakan nilai ini untuk menentukan kotak pembatas yang tepat. Perhatikan bahwa empat koordinat dalam kotak pembatas adalah:

  • koordinat x (jarak dari tepi kiri halaman) sudut kiri atas,
  • koordinat y (jarak dari tepi atas halaman) sudut kiri atas,
  • koordinat x (jarak dari tepi kiri halaman) pojok kanan bawah,
  • koordinat y (jarak dari tepi atas halaman) pojok kanan bawah.

Menghitung kotak pembatas yang tepat untuk setiap halaman dan menggunakannya dapat dilakukan dengan tambalan yang sesuai untuk skrip pdfcrop (ditulis dalam Perl), tetapi karena saya tidak terlalu nyaman dengan Perl, lakukan dengan Python sebagai gantinya di sini skripnya kasus itu berguna untuk seseorang.

Jalankan perintah pdfcrop biasa, dengan --debug , mis .:

Karena --debug , itu tidak akan menghapus file tmp-pdfcrop-*.tex yang dibuatnya. Juga, catat perintah pdftex (atau apa pun) yang dijalankannya di akhir, jika Anda telah memasukkan beberapa opsi khusus ke pdfcrop dan karenanya tidak sepele.

Lewati file tmp-pdfcrop-* melalui skrip di atas, mis .:

Ini akan menulis tmp-pdfcrop-common.tex dengan kotak pembatas yang berbeda.

Jalankan perintah pdftex (atau apa pun) yang dipanggil pdfcrop, dengan file ini:


EmoNets: Pendekatan pembelajaran mendalam multimodal untuk pengenalan emosi dalam video

Tugas Emotion Recognition in the Wild (EmotiW) Challenge adalah menetapkan salah satu dari tujuh emosi ke klip video pendek yang diambil dari film bergaya Hollywood. Video tersebut menggambarkan emosi yang dimainkan dalam kondisi realistis dengan tingkat variasi yang besar dalam atribut seperti pose dan iluminasi, sehingga bermanfaat untuk mengeksplorasi pendekatan yang mempertimbangkan kombinasi fitur dari berbagai modalitas untuk penetapan label. Dalam makalah ini kami menyajikan pendekatan kami untuk mempelajari beberapa model spesialis menggunakan teknik pembelajaran mendalam, masing-masing berfokus pada satu modalitas. Di antaranya adalah jaringan saraf convolutional, yang berfokus pada menangkap informasi visual di wajah yang terdeteksi, jaringan kepercayaan mendalam yang berfokus pada representasi aliran audio, model "kantong mulut" berbasis K-Means, yang mengekstrak fitur visual di sekitar wilayah mulut dan autoencoder relasional, yang membahas aspek spatio-temporal video. Kami mengeksplorasi beberapa metode untuk kombinasi isyarat dari modalitas ini menjadi satu pengklasifikasi umum. Ini mencapai akurasi yang jauh lebih besar daripada prediksi dari pengklasifikasi modalitas tunggal terkuat kami. Metode kami adalah penyerahan pemenang dalam tantangan EmotiW 2013 dan mencapai akurasi set uji 47,67% pada dataset 2014.

Ini adalah pratinjau konten langganan, akses melalui institusi Anda.


Fitur

    Menu judul untuk dipadupadankan—Banyak kursus menyertakan instruksi di lebih dari satu aplikasi perangkat lunak.

      Memungkinkan instruktur untuk menawarkan dasar-dasar beberapa program atau untuk fokus pada kompleksitas lanjutan dari program pilihan mereka.

      Memungkinkan siswa mempelajari dasar-dasar program perangkat lunak saat mereka menyelesaikan proyek dunia nyata.

      Memberi siswa akses mudah dan nyaman ke data proyek.

      Menawarkan kepada siswa penggunaan dan referensi yang mudah saat mereka bekerja di depan komputer mereka. Mantan.___

      Memberi siswa panduan untuk menyelesaikan proyek.

      Dapat diakses oleh siswa, apa pun lingkungan perangkat keras tempat mereka bekerja.

      Mengarahkan siswa ke jenis informasi yang mungkin mereka butuhkan tanpa harus membaca seluruh bagian buku.

      Memberi siswa pratinjau tujuan dan sasaran bab.

      Memberikan siswa wawasan tentang tugas-tugas tertentu.

      Memperkuat kesadaran dasar siswa tentang fungsi perangkat lunak.

      Memberi instruktur sumber daya yang nyaman dan komprehensif untuk materi kursus tambahan.

      Ellenn Behoriam mulai MELAWAN JAM ketika dia menyadari ada kebutuhan besar untuk melatih Profesional Seni Grafis.Pabrikan, seperti perusahaan percetakan direct-press, menghabiskan waktu berjam-jam untuk mengoreksi file dan mengerjakan ulang file akhir yang mereka terima dari pembuat huruf. Program asli Ellenn dirancang untuk menawarkan saran yang kuat kepada para pemula yang mengirimkan proyek yang telah selesai kepada vendor. Sejak itu, Ellenn telah merancang kurikulum MELAWAN JAM untuk sekolah dan lingkungan pelatihan perusahaan.


      1 Jawaban 1

      OverlappingMarkerSpiderfier adalah plugin yang dirancang untuk kelas L.Marker di Leaflet. Dengan demikian, ia hanya menerima objek L.Marker dan tidak dapat menangani L.circleMarker dengan benar, karena didasarkan pada objek L.Circle yang didasarkan pada L.Path . Penghargaan untuk menunjukkan hal ini diberikan kepada @FranceImage.

      Anda tidak dapat menggunakan lapisan L.circleMarker dengan plugin spiderfier, itu akan menjadi glitchy (http://jsfiddle.net/GFarkas/qzdr2w73/). Namun, Anda dapat mengonversi data GeoJSON Anda ke penanda tradisional dengan objek L.Marker. Anda dapat menyesuaikan ikon penanda agar menyerupai objek circleMarker (http://jsfiddle.net/GFarkas/qzdr2w73/4/).

      Untuk melakukan ini dengan mudah, Leaflet menawarkan gaya L.DivIcon yang dapat disesuaikan dengan CSS murni, Anda tidak memerlukan gambar. Untuk membuat lingkaran oranye dengan border solid di CSS, kodenya akan terlihat seperti berikut:

      Bagian terpenting adalah properti border-radius. Ini akan membulatkan bentuk Anda di sudut-sudutnya. Untuk membuat lingkaran biasa dengannya, Anda harus menghitung jari-jari dengan batas. Rumusnya adalah lebar / 2 + batas * 4 jika lebar = tinggi . Setelah Anda membuat CSS, Anda harus membuat objek L.DivIcon untuk digunakan dengan L.Marker :

      Saat merender data GeoJSON ke objek peta, gunakan L.Marker alih-alih L.circleMarker dengan ikon yang dibuat sebelumnya:

      Sekarang untuk menggunakan OverlappingMarkerSpiderfier dengan benar: Anda harus membuat instance OMS sebelum menambahkan data GeoJSON:

      Setelah itu, Anda harus menambahkan setiap penanda ke objek OMS, sehingga perender bawaan dapat menggunakannya. Untuk melakukan ini, gunakan metode onEachFeature dari L.geoJson :

      Terakhir, buat acara yang terkait dengan objek OMS dan penanda yang ada di dalamnya dan tambahkan konten popup ke penanda. Catatan: jika Anda tidak menambahkan beberapa penanda ke objek OMS, itu tidak akan menerapkan efek spiderfy pada mereka. Juga, konten popup dalam kasus saya ada di data GeoJSON (properti -> popupContent).


      1 Jawaban 1

      OverlappingMarkerSpiderfier adalah plugin yang dirancang untuk kelas L.Marker di Leaflet. Dengan demikian, ia hanya menerima objek L.Marker dan tidak dapat menangani L.circleMarker dengan benar, karena didasarkan pada objek L.Circle yang didasarkan pada L.Path . Penghargaan untuk menunjukkan hal ini diberikan kepada @FranceImage.

      Anda tidak dapat menggunakan lapisan L.circleMarker dengan plugin spiderfier, itu akan menjadi glitchy (http://jsfiddle.net/GFarkas/qzdr2w73/). Namun, Anda dapat mengonversi data GeoJSON Anda ke penanda tradisional dengan objek L.Marker. Anda dapat menyesuaikan ikon penanda agar menyerupai objek circleMarker (http://jsfiddle.net/GFarkas/qzdr2w73/4/).

      Untuk melakukan ini dengan mudah, Leaflet menawarkan gaya L.DivIcon yang dapat disesuaikan dengan CSS murni, Anda tidak memerlukan gambar. Untuk membuat lingkaran oranye dengan border solid di CSS, kodenya akan terlihat seperti berikut:

      Bagian terpenting adalah properti border-radius. Ini akan membulatkan bentuk Anda di sudut-sudutnya. Untuk membuat lingkaran biasa dengannya, Anda harus menghitung jari-jari dengan batas. Rumusnya adalah lebar / 2 + batas * 4 jika lebar = tinggi . Setelah Anda membuat CSS, Anda harus membuat objek L.DivIcon untuk digunakan dengan L.Marker :

      Saat merender data GeoJSON ke objek peta, gunakan L.Marker alih-alih L.circleMarker dengan ikon yang dibuat sebelumnya:

      Sekarang untuk menggunakan OverlappingMarkerSpiderfier dengan benar: Anda harus membuat instance OMS sebelum menambahkan data GeoJSON:

      Setelah itu, Anda harus menambahkan setiap penanda ke objek OMS, sehingga perender bawaan dapat menggunakannya. Untuk melakukan ini, gunakan metode onEachFeature dari L.geoJson :

      Terakhir, buat acara yang terkait dengan objek OMS dan penanda yang ada di dalamnya dan tambahkan konten popup ke penanda. Catatan: jika Anda tidak menambahkan beberapa penanda ke objek OMS, itu tidak akan menerapkan efek spiderfy pada mereka. Juga, konten popup dalam kasus saya ada di data GeoJSON (properti -> popupContent).


      EmoNets: Pendekatan pembelajaran mendalam multimodal untuk pengenalan emosi dalam video

      Tugas Emotion Recognition in the Wild (EmotiW) Challenge adalah menetapkan salah satu dari tujuh emosi ke klip video pendek yang diambil dari film bergaya Hollywood. Video tersebut menggambarkan emosi yang dimainkan dalam kondisi realistis dengan tingkat variasi yang besar dalam atribut seperti pose dan iluminasi, sehingga bermanfaat untuk mengeksplorasi pendekatan yang mempertimbangkan kombinasi fitur dari berbagai modalitas untuk penetapan label. Dalam makalah ini kami menyajikan pendekatan kami untuk mempelajari beberapa model spesialis menggunakan teknik pembelajaran mendalam, masing-masing berfokus pada satu modalitas. Di antaranya adalah jaringan saraf convolutional, yang berfokus pada menangkap informasi visual di wajah yang terdeteksi, jaringan kepercayaan mendalam yang berfokus pada representasi aliran audio, model "kantong mulut" berbasis K-Means, yang mengekstrak fitur visual di sekitar wilayah mulut dan autoencoder relasional, yang membahas aspek spatio-temporal video. Kami mengeksplorasi beberapa metode untuk kombinasi isyarat dari modalitas ini menjadi satu pengklasifikasi umum. Ini mencapai akurasi yang jauh lebih besar daripada prediksi dari pengklasifikasi modalitas tunggal terkuat kami. Metode kami adalah penyerahan pemenang dalam tantangan EmotiW 2013 dan mencapai akurasi set uji 47,67% pada dataset 2014.

      Ini adalah pratinjau konten langganan, akses melalui institusi Anda.


      Fitur

        Menu judul untuk dipadupadankan—Banyak kursus menyertakan instruksi di lebih dari satu aplikasi perangkat lunak.

          Memungkinkan instruktur untuk menawarkan dasar-dasar beberapa program atau untuk fokus pada kompleksitas lanjutan dari program pilihan mereka.

          Memungkinkan siswa mempelajari dasar-dasar program perangkat lunak saat mereka menyelesaikan proyek dunia nyata.

          Memberi siswa akses mudah dan nyaman ke data proyek.

          Menawarkan kepada siswa penggunaan dan referensi yang mudah saat mereka bekerja di depan komputer mereka. Mantan.___

          Memberi siswa panduan untuk menyelesaikan proyek.

          Dapat diakses oleh siswa, apa pun lingkungan perangkat keras tempat mereka bekerja.

          Mengarahkan siswa ke jenis informasi yang mungkin mereka butuhkan tanpa harus membaca seluruh bagian buku.

          Memberi siswa pratinjau tujuan dan sasaran bab.

          Memberikan siswa wawasan tentang tugas-tugas tertentu.

          Memperkuat kesadaran dasar siswa tentang fungsi perangkat lunak.

          Memberi instruktur sumber daya yang nyaman dan komprehensif untuk materi kursus tambahan.

          Ellenn Behoriam mulai MELAWAN JAM ketika dia menyadari ada kebutuhan besar untuk melatih Profesional Seni Grafis. Pabrikan, seperti perusahaan percetakan direct-press, menghabiskan waktu berjam-jam untuk mengoreksi file dan mengerjakan ulang file akhir yang mereka terima dari pembuat huruf. Program asli Ellenn dirancang untuk menawarkan nasihat yang kuat kepada para pemula yang mengirimkan proyek yang telah selesai kepada vendor. Sejak itu, Ellenn telah merancang kurikulum MELAWAN JAM untuk sekolah dan lingkungan pelatihan perusahaan.


          Sistem Pendukung Teleophthalmology Berdasarkan Visibilitas Elemen Retina Menggunakan CNN

          Gaya penulisan perlu perbaikan substansial untuk membuatnya lebih struktural. Diperlukan pemeriksaan menyeluruh dari bahasa Inggris. Jumlah kesalahan tata bahasa yang ada (terlalu banyak kesalahan untuk dicantumkan semuanya di sini). Banyak, kalimat yang terlalu panjang membuat pembacaan menjadi sulit. Beberapa typo juga.

          Tidak jelas mengapa penting untuk membagi organ yang berbeda (OD, pembuluh darah, &hellip).

          Posisi pandangan yang benar juga harus diperiksa. Para dokter mata menggunakan untuk mengambil pandangan hidung, tengah atau lateral.

          Beberapa pilihan arsitektur tampak aneh dan harus dibenarkan. Misalnya, tentang OD. Anda melatih VGG16 dari awal untuk mendeteksi OD tetapi menggunakan pembelajaran transfer untuk estimasi kualitas. Kenapa begitu? Juga, VGG16 adalah model yang sangat besar, perasaan saya mungkin terlalu besar untuk tugas itu. Dalam konteks oftalmoskop portabel, model yang lebih kecil (seperti SSD MobileNet) akan lebih relevan untuk deteksi objek. SSD MobileNet memiliki

          Parameter 1M sedangkan VGG16 lebih dari 15M.

          Anda akan mendapatkan waktu pemrosesan yang lebih singkat dengan jaringan yang lebih kecil. Yang memang tampaknya juga menjadi salah satu perhatian Anda. Waktu berjalan yang singkat penting bagi pasien untuk menghindari pengambilan foto tambahan jika sudah memiliki kualitas yang memadai. Anda tentu tidak ingin membiarkan pasien menunggu terlalu lama setelah setiap foto.

          Bagaimana kualitas gambar terbaik secara keseluruhan dipilih berdasarkan beberapa kriteria kualitas parsial? Menurut Gambar 2, menurut pemahaman saya, ini adalah jumlah atau urutan dari beberapa pemeriksaan/kegagalan QL biner. Jika semua QL OK, maka gambar diterima dan akuisisi berhenti. Jika tidak, paling banyak 5 foto yang diambil. Bagaimana Anda memilih yang terbaik? Bagaimana Anda membuktikan pilihan itu?

          Apresiasi keseluruhan : karya ini terdiri dari beberapa aplikasi dari berbagai CNN untuk melakukan tugas tertentu.

          Evaluasi? Saya memiliki keraguan tentang evaluasi. Anda mengklaim menggunakan sensitivitas, spesifisitas dan akurasi. Tetapi tindakan apa yang Anda gunakan untuk berbagai tugas ini, seperti OD, segmentasi kapal, estimasi kualitas? Sifat yang berbeda dari tugas-tugas ini mungkin memerlukan penggunaan ukuran yang berbeda: DICE, jaccard, &hellip dll.

          Mengenai perbandingan dengan yang ada, sensitivitas referensi [25] pada Tabel 3 tampaknya sangat buruk, jauh di bawah apa yang dilaporkan dalam makalah mereka dan pada kumpulan data publik. Apakah Anda sendiri yang menerapkannya? Apakah Anda adil dengan implementasinya? Waktu yang dilaporkan juga aneh.

          Perbandingan dengan hasil dalam literatur harus diperluas. Literatur berlimpah tentang hal ini.

          Tepatnya apa yang dimaksud dengan « ahli » dan « dokter umum ».

          Saran: bisakah Anda membuat gambar lebih terang dan lebih besar untuk keperluan pencetakan?

          Gaya penulisan perlu perbaikan substansial untuk membuatnya lebih struktural. Diperlukan pemeriksaan menyeluruh dari bahasa Inggris. Jumlah kesalahan tata bahasa yang ada (terlalu banyak kesalahan untuk dicantumkan semuanya di sini). Banyak, kalimat yang terlalu panjang membuat pembacaan menjadi sulit. Beberapa typo juga.

          Terima kasih telah meninjau makalah kami dan kami mohon maaf atas banyak kesalahan bahasa Inggris di makalah ini. Kami dengan hati-hati merevisi makalah dan mengoreksi kesalahan tata bahasa dan kesalahan ketik. Kami berharap bahwa versi revisi telah ditingkatkan sesuai dengan persyaratan Jurnal.

          Terima kasih atas pertanyaan Anda. Mengenai pertanyaan Anda, kami memberikan tanggapan berikut, dari sudut pandang dokter mata. Dalam versi revisi, kami menambahkan deskripsi singkat untuk memperjelas masalah ini.

          Retina adalah satu-satunya organ yang dapat dinilai melalui kamera tanpa memerlukan prosedur invasif. Untuk mendapatkan evaluasi yang komprehensif, dokter mata perlu membatasi landmark paling penting untuk retina, yaitu pembuluh darah dan saraf optik yang dapat diamati di dalam OD. Visibilitas yang baik dari elemen-elemen tersebut sangat penting untuk mendeteksi atau mendiagnosis sejumlah besar penyakit mata. Misalnya, visibilitas yang baik dari saraf optik sangat penting dalam mendeteksi glaukoma atau penyakit neuro-oftalmologi atau vaskular lainnya. Salah satu penyakit mata yang paling umum adalah retinopati diabetik, penyakit yang dimulai pada pembuluh retina yang menyoroti pentingnya segmentasi juga. Akhirnya, segmentasi pembuluh darah dan saraf optik, memungkinkan kita untuk menggambarkan area retina seperti makula yang merupakan area antara arcade vaskular temporal dan bagian terpenting dari retina di mana penglihatan membaca berada dan di mana banyak penyakit mata. Mulailah. Kami menambahkan satu kalimat (baris 91-94) yang terkait dengannya dalam versi revisi.

          1. Posisi pandangan yang benar juga harus diperiksa. Dokter mata menggunakan untuk mengambil pandangan hidung, tengah atau lateral.

          Terima kasih atas pengamatan Anda. Jika kita menggunakan kamera fundus umum dengan FOV 45° untuk memperoleh gambar retina, diperlukan untuk mengambil beberapa gambar (tampak hidung, tengah dan lateral) untuk memiliki komposisi gambar retina. Namun, itu tidak diperlukan dalam penelitian kami karena kami menggunakan pemindaian laser oftalmoskop (SLO) sebagai perangkat utama kami untuk menangkap gambar. SLO ini memungkinkan kita mendapatkan gambar retina ultra-widefield ini berarti bahwa dengan kualitas gambar yang baik kita dapat memperoleh informasi sekitar 200&derajat retina berbeda dengan model lain yang mendapatkan 30&derajat hingga 45&derajat. Karakteristik ini memungkinkan kita menghilangkan kebutuhan pasien untuk memutar kepala ke arah yang berbeda untuk mendapatkan komposisi gambar. Dalam lingkungan teleophthalmology, 200° sentral adalah yang paling berharga, jika dicurigai ada patologi di perifer, pasien harus selalu pergi ke spesialis. Dalam versi revisi, deskripsi SLO yang disebutkan di atas ditambahkan untuk memperjelas masalah ini. Kami menambahkan satu kalimat (baris 47-48) dalam versi revisi.

            Beberapa pilihan arsitektur tampak aneh dan harus dibenarkan. Misalnya, tentang OD. Anda melatih VGG16 dari awal untuk mendeteksi OD tetapi menggunakan pembelajaran transfer untuk estimasi kualitas. Kenapa begitu? Juga, VGG16 adalah model yang sangat besar, perasaan saya mungkin terlalu besar untuk tugas itu. Dalam konteks oftalmoskop portabel, model yang lebih kecil (seperti SSD MobileNet) akan lebih relevan untuk deteksi objek. SSD MobileNet memiliki

          Terima kasih atas komentar Anda tentang pemilihan model CNN. Untuk pemilihannya, kami merujuk makalah berikut:

          2017. Huang dkk. &ldquoPertukaran kecepatan/akurasi untuk detektor objek konvolusi modern&rdquo, IEEE Conf. tentang Visi Komputer dan Pengenalan Pola, 2017.

          Dalam makalah ini, penulis menunjukkan bahwa Faster-RCNN dengan VGG16 memberikan akurasi yang lebih baik dibandingkan dengan SSD MobileNet, ketika objek yang diinginkan kecil. Dalam kasus kami, gambar retina memiliki 3900 x 3072 piksel, sedangkan ukuran OD sekitar 165x165 piksel, yang berarti bahwa OD, objek yang kami minati, sangat kecil, hanya menempati 0,2% di seluruh gambar. Jadi, kami memilih Faster-RCNN dengan VGG16 sesuai dengan saran dari makalah Huang. Dalam versi revisi, kami menambahkan justifikasi pilihan CNN pada baris 197-203.

          Tentang komentar Anda &ldquoAnda melatih VGG16 dari awal untuk mendeteksi OD tetapi menggunakan pembelajaran transfer untuk estimasi kualitas.&rdquo, kami menggunakan pembelajaran transfer dalam kedua kasus (deteksi OD dan penilaian kualitas). Dalam versi revisi, kami menambahkan baris 221.

          Tentang komentar Anda &ldquoJuga, VGG16 adalah model yang sangat besar, perasaan saya bahkan mungkin terlalu besar untuk tugas itu. Dalam konteks oftalmoskop portabel, model yang lebih kecil (seperti SSD MobileNet) akan lebih relevan untuk deteksi objek. SSD MobileNet memiliki

          Parameter 1M sedangkan VGG16 lebih dari 15M.&rdquo

          Kami menyetujui komentar Anda untuk oftalmoskop portabel. Namun, kami tidak mempertimbangkan oftalmoskop portabel. Sistem pendukung teleophthalmology yang diusulkan dianggap sebagai bagian dari proyek teleophthalmology kami, di mana perhitungan akan dilakukan di lingkungan cloud. Dalam hal ini, ruang memori bukanlah kebutuhan utama, meskipun kami menganggap bahwa MobileNet dapat menjadi alternatif yang baik. SLO yang kami gunakan untuk menangkap gambar tidak portabel, sehingga SLO harus dalam posisi tetap, meskipun sistem yang diusulkan digunakan di klinik keliling. Dalam versi revisi, kami menambahkan baris 560-563 untuk menjelaskan secara singkat masalah yang disebutkan di atas.

          Dalam versi makalah sebelumnya, kami tidak menyebutkan tentang proyek masa depan kami dan alasan utama pemilihan model CNN. Dalam versi revisi, kami membenarkan pemilihan model CNN.

          1. Anda akan mendapatkan waktu pemrosesan yang lebih singkat dengan jaringan yang lebih kecil. Yang memang tampaknya juga menjadi salah satu perhatian Anda. Waktu berjalan yang singkat penting bagi pasien untuk menghindari pengambilan foto tambahan jika sudah memiliki kualitas yang memadai. Anda tentu tidak ingin membiarkan pasien menunggu terlalu lama setelah setiap foto.

          Terima kasih atas komentar Anda yang bermanfaat. Kami sepakat bahwa waktu eksekusi harus cukup singkat. Waktu berlalunya sistem yang diusulkan menentukan bahwa satu gambar retina berkualitas tinggi, kira-kira 11,3 detik dari pengambilan foto. Kali ini rata-rata diperoleh dengan menggunakan 10 gambar berkualitas tinggi. Kami berharap waktu eksekusi dapat dikurangi lebih lanjut di lingkungan cloud. Dalam versi makalah yang direvisi, kami menambahkan waktu berlalu rata-rata dalam tingkat kualitas yang berbeda pada tabel 10 (baris 516) dan deskripsi singkat pada baris 515-519.

          1. Bagaimana kualitas gambar terbaik secara keseluruhan dipilih berdasarkan beberapa kriteria kualitas parsial? Menurut Gambar 2, menurut pemahaman saya, ini adalah jumlah atau urutan dari beberapa pemeriksaan/kegagalan QL biner. Jika semua QL OK, maka gambar diterima dan akuisisi berhenti. Jika tidak, paling banyak 5 foto yang diambil. Bagaimana Anda memilih yang terbaik? Bagaimana Anda membuktikan pilihan itu?

          Gambar retina harus melewati tiga pemeriksaan biner: deteksi OD sebagai pemeriksaan pertama, kualitas OD sebagai pemeriksaan kedua, dan keberadaan artefak di ROI sebagai pemeriksaan ketiga. Gambar retina yang melewati tiga pemeriksaan biner ini dianggap sebagai gambar berkualitas baik. Seperti yang Anda sebutkan: &ldquoJika semua QL OK, maka gambar diterima dan akuisisi berhenti&rdquo, sehingga dalam kasus terbaik hanya satu foto yang diambil. Di sisi lain, dalam kasus terburuk, di mana 5 foto harus diambil, foto dengan nilai QL yang lebih besar dipilih sebagai gambar dengan kualitas lebih baik di antara foto-foto tersebut. Jika ada beberapa foto dengan tingkat kualitas (QL) yang sama, yang terakhir dipilih sebagai yang lebih baik. Terima kasih atas komentar Anda, dalam versi revisi makalah, kami menjelaskan lebih baik proses sistem yang diusulkan (baris 186-189)

          1. Evaluasi : Saya ragu dengan evaluasinya. Anda mengklaim menggunakan sensitivitas, spesifisitas dan akurasi. Tetapi tindakan apa yang Anda gunakan untuk berbagai tugas ini, seperti OD, segmentasi kapal, estimasi kualitas? Sifat yang berbeda dari tugas-tugas ini mungkin memerlukan penggunaan ukuran yang berbeda: DICE, jaccard, &hellip dll.

          Terima kasih atas saran Anda yang berharga. Kami memperkenalkan metrik DICE dan jaccard untuk mengevaluasi metode segmentasi kapal kami dalam versi yang direvisi. Pada tabel 6, kami menambahkan nilai dari dua metrik ini. Kami merevisi beberapa metode segmentasi kapal dalam literatur, namun kami tidak dapat menemukan metode apa pun yang menggunakan dua metrik ini (DICE dan jaccard) atau salah satunya untuk evaluasi kinerja. Metrik ini biasanya digunakan untuk segmentasi penyakit mata, seperti eksudat keras.Kami menemukan makalah baru-baru ini, di mana penulis menggunakan fungsi kerugian DICE alih-alih fungsi kerugian umum, seperti cross-entropy, di CNN U-net, namun mereka melaporkan akurasi, kepekaan, dan spesifisitas kinerja mereka. Dalam versi revisi, kami menambahkan baris 432-434 untuk nilai metrik DICE dan Jaccard, dan kinerja &ldquoU-net dengan fungsi rugi DICE&rdquo pada tabel 7 untuk tujuan perbandingan.

          1. Mengenai perbandingan dengan yang ada, sensitivitas referensi [25] pada Tabel 3 tampaknya sangat buruk, jauh di bawah apa yang dilaporkan dalam makalah mereka dan pada kumpulan data publik. Apakah Anda sendiri yang menerapkannya? Apakah Anda adil dengan implementasinya? Waktu yang dilaporkan juga aneh.

          Hasil dari ref. [25] pada Tabel 3 diperoleh oleh kami, karena metode deteksi OD apa pun untuk gambar yang diambil dengan ultrawide-FOV SLO belum dilaporkan dalam literatur. Kami mengevaluasi kinerja deteksi OD menggunakan database kami sendiri dan DRIMBD, yang hanya merupakan database publik untuk kualitas gambar retina. Kedua database berisi banyak gambar berkualitas rendah. Dalam metode [25], template histogram dari wilayah OD dibangun, dan histogram dari semua blok dibandingkan dengan template untuk memilih satu blok dengan kesamaan tertinggi sebagai OD. Metode ini bekerja dengan baik jika hampir semua gambar dari kumpulan data berkualitas baik, namun kinerjanya menurun ketika kumpulan data berisi beberapa gambar berkualitas rendah, tidak mendeteksi wilayah OD sebagai OD. Mengenai running time [25], metode menghitung histogram setiap blok dan jumlah blok sebanding dengan jumlah piksel, kemudian running time juga sebanding dengan ukuran citra. Ukuran gambar dari kumpulan data kita sendiri (3900 x 3072) jauh lebih besar daripada kumpulan data publik (misalnya, 565 x 584 dalam DRIVE). Kami menganggap bahwa ini adalah alasan waktu berjalan yang berlebihan dari metode ini untuk gambar kami sendiri. Dalam versi revisi, kami menambahkan analisis kami di baris 374-378.

          1. Perbandingan dengan hasil dalam literatur harus diperluas. Literatur berlimpah tentang hal ini.

          Terima kasih atas saranmu. Kami setuju bahwa ada banyak metode penilaian kualitas retina dalam literatur. Namun, kami tidak dapat menemukan sistem apa pun dalam literatur dengan tujuan serupa dari sistem yang diusulkan, sehingga sulit untuk menunjukkan perbandingan yang berarti karena alasan yang disebutkan di bawah ini:

          Kontribusi utama dari sistem pendukung teleophthalmology yang diusulkan adalah:

          • Berikan informasi yang cukup kepada operator SLO jika citra retina yang diambil berkualitas rendah untuk diagnosis yang andal. Dengan cara ini, operator dapat mengambil gambar dengan kualitas lebih baik untuk dikirim ke rumah sakit pusat.
          • Rumah sakit pusat tidak hanya menerima gambar dengan kualitas terbaik, tetapi juga menerima beberapa gambar tambahan, seperti gambar OD, gambar pembuluh biner dan gambar ROI, bersama dengan laporan yang dihasilkan oleh sistem. Dengan menggunakan semua informasi tentang gambar retina, dokter mata dapat melakukan diagnosa yang dapat diandalkan di bawah ketidakhadiran pasien.

          Bahkan dalam literatur telah dilaporkan beberapa sistem yang efisien untuk penilaian kualitas gambar, salah satunya memberikan kepada dokter mata semua informasi yang diperlukan untuk diagnostik yang andal saat pasien tidak ada.

          Dalam versi revisi, kami menambahkan beberapa deskripsi terkait masalah ini di baris 91-94 dan baris 560-563.

          Kami menggunakan istilah &ldquoPakar&rdquo sebagai dokter mata yang belajar lebih dari 3 tahun di rumah sakit mata setelah lulus dari fakultas kedokteran, sedangkan kami menggunakan istilah &ldquodokter umum&rdquo sebagai dokter yang lulus dari fakultas kedokteran, tetapi belum menyelesaikan spesialisasi oftalmologi. Para ahli mengevaluasi beberapa gambar retina sebagai pekerjaan sehari-harinya. Dalam versi revisi, kami menetapkan istilah-istilah ini di baris 461-464. Terima kasih atas komentarmu.

          Saran: bisakah Anda membuat gambar lebih terang dan lebih besar untuk keperluan pencetakan?

          Terima kasih atas saranmu. Mengikuti saran Anda, kami meningkatkan kualitas gambar 2, 3 dan 10 untuk tujuan pencetakan dalam versi revisi.

          Naskah ini menyajikan sistem untuk mengawasi dan membantu meningkatkan akuisisi citra di teleophthalmology. Juga tujuannya adalah untuk memberikan segmentasi dan analisis elemen anatomi utama retina. Kebaruan makalah ini terbatas karena semua jaringan saraf convolutional yang digunakan dalam makalah sudah terkenal. Deteksi cakram optik, penilaian kualitas dan segmentasi pembuluh darah juga sangat umum dalam literatur. Kontribusi utama adalah bahwa, dalam kasus akuisisi gambar berkualitas rendah, sistem memberikan kemungkinan alasan yang menyebabkannya, sehingga operator dapat memperbaiki masalah dengan bidikan baru sebelum mengirim laporan ke rumah sakit.

          Makalah ini terstruktur dengan baik tetapi bahasa Inggris harus sangat ditingkatkan. Ada banyak kesalahan mengenai tata bahasa/gaya penulisan. Saya pikir manuskrip harus melalui tinjauan ekstensif. Dari sudut pandang cara naskah saat ini disajikan, itu tidak dapat diterima.

          Dari sudut pandang kesehatan ilmiah naskah, mungkin dapat diterima. Kelemahan utama adalah kurangnya orisinalitas dalam algoritma yang digunakan. Bahkan Jaringan Saraf Konvolusional Berbasis Wilayah Cepat yang lebih spesifik yang diterapkan untuk mendeteksi cakram optik sudah disajikan di makalah

          1. Sadhukhan, G. K. Ghorai, S. Maiti, G. Sarkar dan A. K. Dhara, "Lokalisasi Disk Optik pada Gambar Retina Fundus menggunakan R-CNN Lebih Cepat," Konferensi Internasional Kelima 2018 tentang Emerging Applications of Information Technology (EAIT), Kolkata, 2018, hlm. 1-4. Makalah ini tidak disebutkan dalam naskah.

          Kekuatan kertas adalah tingginya jumlah gambar yang digunakan untuk mengembangkan dan melatih sistem. Juga akurasi yang dicapai. Mengenai kekuatan pertama, akan sangat menarik, dan kontribusi yang besar, jika dataset tersedia untuk komunitas ilmiah. Ada beberapa kumpulan data gambar mata dan fundus seperti DRIMBD, MESSIDOR, dll., tetapi yang besar dengan Optos SLO dengan lokalisasi disk optik manual yang dianotasi akan sangat dihargai. Mengenai kekuatan kedua, akan lebih mudah bahwa sistem dapat diuji secara online, melalui halaman web atau serupa, di mana gambar acak dari kumpulan data dapat dicoba atau gambar pihak ketiga dapat diunggah dan diproses.

          Koreksi dan saran tambahan ada di bawah.

          Untuk menghasilkan dataset pelatihan, kotak pembatas diberi label secara manual di setiap gambar pelatihan dari dataset, seperti yang ditunjukkan pada Gambar .

          Berapa ukuran kotak pembatas?

          Jika Pr(??) > ?h?? maka kotak pembatas yang terdeteksi dianggap sebagai wilayah OD.

          Apakah semua 12880 gambar dengan lokalisasi disk optik diberi label secara manual? Jika demikian, akan sangat dihargai jika upaya besar seperti itu diumumkan kepada publik, seperti yang disebutkan di atas.

          Tautan tidak mencapai informasi yang disebutkan. Di sana, ada banyak komite.

          Dibutuhkan link yang lebih tepat.

          Menghadapi rumus (1)-(8) pada Gambar 7, terlihat bahwa X dalam rumus bersesuaian dengan dimensi vertikal dan Y dengan dimensi horizontal. Ini tidak umum. Saya pikir cara ini dipilih, itu harus dikatakan dalam teks dan/atau secara eksplisit ditunjukkan pada gambar.

          Tidak cukup jelas bagaimana tambalan diperoleh dari gambar.

          Apakah teknik superpiksel diterapkan pada seluruh gambar atau pada ROI. Apakah ini menggunakan resolusi penuh atau versi 224x224x3 yang di-downsampling? Apakah downsampling merupakan langkah terakhir, diterapkan setelah superpixel, dan croping ROI?

          Apa alasan untuk mencoba vgg16 dan MobileNet untuk segmentasi kapal daripada vgg16 dan Alexnet seperti yang digunakan dalam analisis obstruksi?

          baris: 436 kalimatnya tidak selesai

          Dalam eksperimen ini, dua dokter mata ahli yang bekerja di bagian retina rumah sakit mata dan lima dokter umum yang bekerja di rumah sakit mata yang sama sebagai relawan bakti sosial.

          Saya pikir Gambar 16 tidak diperlukan. Lebih kurang kontribusinya dapat dilihat pada Gambar 17.

          masukan gambar retina yang diambil oleh oftalmoskop non-midriatik, seperti Scanning Lases Ophthalmoscopes (SLO)

          menurut -- menurut

          Kami mengevaluasi kinerja setiap proses --

          Kami mengevaluasi kinerja setiap proses

          1. Naskah ini menyajikan sistem untuk mengawasi dan membantu meningkatkan akuisisi citra di teleophthalmology. Juga tujuannya adalah untuk memberikan segmentasi dan analisis elemen anatomi utama retina. Kebaruan makalah ini terbatas karena semua jaringan saraf convolutional yang digunakan dalam makalah sudah terkenal. Deteksi cakram optik, penilaian kualitas dan segmentasi pembuluh darah juga sangat umum dalam literatur. Kontribusi utama adalah bahwa, dalam kasus akuisisi gambar berkualitas rendah, sistem memberikan kemungkinan alasan yang menyebabkannya, sehingga operator dapat memperbaiki masalah dengan bidikan baru sebelum mengirim laporan ke rumah sakit.

          Tanggapan: Terima kasih telah meringkas makalah kami dan tujuan utama penelitian kami.

          1. Makalah ini terstruktur dengan baik tetapi bahasa Inggris harus sangat ditingkatkan. Ada banyak kesalahan mengenai tata bahasa/gaya penulisan. Saya pikir manuskrip harus melalui tinjauan ekstensif. Dari sudut pandang cara naskah saat ini disajikan, itu tidak dapat diterima.

          Tanggapan: Kami mohon maaf atas banyak kesalahan bahasa Inggris dan kesalahan ketik dalam makalah kami. Kami merevisi makalah kami dengan hati-hati. Dalam versi makalah yang direvisi, kami memperbaiki semua kesalahan ketik dan kesalahan tata bahasa.

          1. Dari sudut pandang kesehatan ilmiah naskah, mungkin dapat diterima. Kelemahan utama adalah kurangnya orisinalitas dalam algoritma yang digunakan. Bahkan Jaringan Saraf Konvolusional Berbasis Wilayah Cepat yang lebih spesifik yang diterapkan untuk mendeteksi cakram optik sudah disajikan di makalah

          Sadhukhan, G. K. Ghorai, S. Maiti, G. Sarkar dan A. K. Dhara, "Lokalisasi Disk Optik pada Gambar Retina Fundus menggunakan R-CNN Lebih Cepat," Konferensi Internasional Kelima 2018 tentang Emerging Applications of Information Technology (EAIT), Kolkata, 2018, hlm. 1-4. Makalah ini tidak disebutkan dalam naskah.

          Tanggapan: Kami setuju dengan pendapat Anda, CNN yang kami gunakan dalam sistem yang diusulkan sebelumnya diusulkan untuk tujuan lain. Metode lokalisasi OD diusulkan oleh Sadnukhan et al. menggunakan arsitektur jaringan CIFAR-10 di bagian ekstraksi fitur Faster R-CNN. Ukuran citra masukan CNN CIFRA-10 harus 32 x 32. Jadi, arsitektur ini cocok untuk objek kepentingan yang berukuran relatif kecil (wilayah OD), karena setelah mengubah ukuran wilayah OD menjadi 32x32 piksel untuk menjadi masukan CIFRA -10 CNN, OD mempertahankan karakteristiknya. Namun, arsitektur ini tidak berkinerja baik untuk gambar berukuran besar (misalnya 3900 x 3072 piksel sebagai gambar SLO), karena pada gambar SLO, wilayah OD kira-kira 168 x 168 piksel, maka OD harus diubah ukurannya dan setelah mengubah ukuran dalam 32x32 karakteristik yang relevan OD mungkin hilang.

          1. Kekuatan kertas adalah tingginya jumlah gambar yang digunakan untuk mengembangkan dan melatih sistem. Juga akurasi yang dicapai. Mengenai kekuatan pertama, akan sangat menarik, dan kontribusi yang besar, jika dataset tersedia untuk komunitas ilmiah. Ada beberapa kumpulan data gambar mata dan fundus seperti DRIMBD, MESSIDOR, dll., tetapi yang besar dengan Optos SLO dengan lokalisasi disk optik manual yang dianotasi akan sangat dihargai. Mengenai kekuatan kedua, akan lebih mudah jika sistem dapat diuji secara online, melalui halaman web atau serupa, di mana gambar acak dari kumpulan data dapat dicoba, atau gambar pihak ketiga dapat diunggah dan diproses.

          Tanggapan: Terima kasih atas komentar Anda yang bermanfaat. Mengenai kumpulan data yang tersedia untuk komunitas ilmiah, kami sepenuhnya menyetujui proposal Anda. Kami akan mengatur semua gambar dengan Ground Truth (GT) dan, kami akan membintangi proses yang ditentukan untuk mempublikasikan dataset kami. Mengenai sistem yang diusulkan dapat diuji secara online, kami memiliki rencana untuk menginstal sistem yang diusulkan di lingkungan komputasi awan untuk diuji secara bebas oleh komunitas ilmiah.

          Koreksi dan saran tambahan ada di bawah.

          baris 203: Untuk menghasilkan dataset pelatihan, kotak pembatas diberi label secara manual di setiap gambar pelatihan dari dataset, seperti yang ditunjukkan pada Gambar .

          Berapa ukuran kotak pembatas?

          Tanggapan: Ukuran kotak pembatas bervariasi tergantung pada gambar. Tinggi dan lebar rata-rata masing-masing adalah 167,85 dan 169,91 piksel. Varian tinggi dan lebar masing-masing adalah 23,94 dan 26,09 piksel. Dalam versi revisi, kami menambahkan ukuran kotak pembatas pada baris 214-218.

          baris 200: Jika Pr(??) > ?h?? maka kotak pembatas yang terdeteksi dianggap sebagai wilayah OD.

          Apakah semua 12880 gambar dengan lokalisasi disk optik diberi label secara manual? Jika demikian, akan sangat dihargai jika upaya besar seperti itu diumumkan kepada publik, seperti yang disebutkan di atas.

          Tanggapan: Ukuran database asli kami adalah 1288. Kami menerapkan teknik augmentasi data untuk setiap gambar untuk mendapatkan total 12880 gambar. Setelah augmentasi data, kami secara manual membatasi kotak pembatas untuk masing-masing 12880 gambar menggunakan alat Pelabelan Matlab. Dalam versi revisi kami menyebutkan nomor gambar asli pada baris 136 dan 216.

          baris 236: Tautan tidak mencapai informasi yang disebutkan. Di sana, ada banyak komite.https://www.gov.uk/government/groups/uk-national-screening-comite-uk-nsc. Dibutuhkan link yang lebih tepat.

          Tanggapan: Kami mohon maaf atas ketidaktepatan ini. Judul dokumennya adalah &ldquoUK KOMITE PEMERIKSAAN NASIONAL Elemen Penting dalam Mengembangkan Program Skrining Retinopati Diabetik&rdquo dan tautannya adalah sebagai berikut.

          Halaman 76-78 dokumen menyebutkan tentang visibilitas wilayah termasuk makula, DO dan pembuluh darah untuk skrining DR. Dalam versi revisi makalah, kami mengoreksi referensi [24].

          baris 246: Menghadapi rumus (1)-(8) ke Gambar 7, tampaknya X dalam rumus sesuai dengan dimensi vertikal dan Y dengan dimensi horizontal. Ini tidak umum. Saya pikir cara ini dipilih, itu harus dikatakan dalam teks dan/atau secara eksplisit ditunjukkan pada gambar.

          Tanggapan: Terima kasih atas saran Anda. Untuk memudahkan pemahaman, dalam versi revisi kami memodifikasi persamaan (1)-(8) dan Gambar 7 menurut cara yang umum: X adalah indeks kolom dan Y adalah indeks baris.

          baris 284: Tidak cukup jelas bagaimana tambalan diperoleh dari gambar.

          Tanggapan: Kami memperoleh 100 tambalan secara acak dari masing-masing dari 10 gambar dengan artefak (bulu mata dan kelopak mata). Kemudian teknik augmentasi data diterapkan pada 100 tambalan ini untuk meningkatkan secara artifisial menjadi 500 tambalan per gambar. Secara total, kami membuat 5000 patch untuk melatih SegNet. 80% dari total 5000 patch digunakan dalam proses pelatihan dan 20% sisanya digunakan untuk pengujian. Dalam versi makalah yang direvisi, kami memodifikasi deskripsi untuk memperjelas cara mendapatkan tambalan di baris 296-299.

          Apakah teknik superpiksel diterapkan pada seluruh gambar atau pada ROI. Apakah menggunakan resolusi penuh atau versi 224x224x3 downsampled? Apakah downsampling merupakan langkah terakhir, diterapkan setelah superpixel, dan croping ROI?

          Tanggapan: Ya, kami menerapkan teknik piksel super ke seluruh gambar dengan resolusi penuh. Kami menetapkan jumlah piksel super menjadi 1000 untuk seluruh gambar. Tujuan penggunaan super-piksel adalah konstruksi yang efektif dari Ground Truth dari piksel artefak, seperti bulu mata dan kelopak mata. Teknik super-piksel memungkinkan kami menghasilkan Ground Truth (GT) artefak (bulu mata dan kelopak mata) lebih mudah dan lebih efektif. Setelah gambar GT biner dibangun, mereka digunakan untuk melatih SegNet CNN. Seperti disebutkan di atas, teknik augmentasi data yang sama diterapkan pada patch GT yang sesuai untuk menghasilkan patch 5000 GT. Dalam versi makalah yang direvisi, kami memperkuat deskripsi untuk memperjelas penggunaan teknik piksel super pada baris 273-275 dan baris 280-281.

          baris 372: diajukan -- diusulkan

          baris 374: belajar & belajar ndash

          Tanggapan: Kami mohon maaf atas kesalahan ini. Kami memperbaiki kesalahan ini dan meninjau dengan cermat untuk menghindari kesalahan ketik.

          baris 402: Apa alasan untuk mencoba vgg16 dan MobileNet untuk segmentasi kapal daripada vgg16 dan Alexnet seperti yang digunakan dalam analisis obstruksi?

          Tanggapan: Kami membuktikan SegNet dengan vgg16 dan MobileNet untuk tugas segmentasi pembuluh darah, dan SegNet dengan vgg16 untuk deteksi artefak (bulu mata dan kelopak mata). Karena SegNet dengan vgg16 memberikan segmentasi yang lebih presisi. Kami meninjau redaksi makalah kami untuk mengklarifikasi bahwa Alexnet tidak digunakan dalam tugas-tugas ini.

          baris 433: andal & ndash andal

          Tanggapan: Kami mohon maaf atas kesalahan ini. Kami memperbaiki kesalahan dan merevisi kertas dengan hati-hati.

          baris: 436 kalimatnya tidak selesai

          Dalam percobaan ini, dua dokter mata ahli yang bekerja di departemen retina rumah sakit mata lebih dari tiga tahun dan lima dokter umum yang bekerja di rumah sakit mata yang sama sebagai relawan layanan sosial berpartisipasi dalam proses evaluasi.

          Tanggapan: Kami mohon maaf atas kalimat yang tidak lengkap. Kami mengoreksi kalimat ini pada baris 458-461 dalam versi revisi.

          baris 438: evaluasi -- evaluasi

          baris 442: terdistorsi -- terdistorsi

          baris 447, Tabel 8 deviasi & ndash deviasi

          baris 482: Saya pikir Gambar 16 tidak diperlukan. Lebih kurang kontribusinya dapat dilihat pada Gambar 17.

          Tanggapan: Terima kasih atas saran Anda. Kami menghilangkan Gambar 16 dari versi revisi makalah.

          masukan gambar retina yang diambil oleh oftalmoskop non-midriatik, seperti Scanning Lases Ophthalmoscopes (SLO)

          baris 504 menurut -- menurut

          baris 505 Kami mengevaluasi kinerja setiap proses --

          Kami mengevaluasi kinerja setiap proses

          Tanggapan: Kami mohon maaf atas kesalahan ini. Kami mengoreksi kesalahan dan dengan hati-hati merevisi versi makalah yang direvisi.

          Semuanya telah ditinjau dan baik-baik saja, tetapi dataset dengan kebenaran dasar belum dipublikasikan atau situs web dengan sistem.

          Terima kasih telah meninjau makalah kami.

          Butir 1: Semuanya telah ditinjau dan baik-baik saja, tetapi dataset dengan ground-truth belum dipublikasikan atau situs web dengan sistem.

          Tanggapan: Sehubungan dengan pertanyaan Anda, kumpulan data dan sistem akan dipublikasikan setelah didaftarkan di kantor kekayaan intelektual Meksiko. Sayangnya, karena pandemi, semua kantor pemerintah Meksiko ditutup. Setelah pendaftaran diperoleh, database akan tersedia untuk komunitas riset tanpa biaya.


          Saya menemukan bahwa --verbose flag akan menampilkan kotak pembatas yang digunakan pada setiap langkah. Karena ini adalah animasi "berkembang", halaman terakhir adalah yang terbesar.

          Jadi untuk mendapatkan semuanya dengan ukuran yang sama, saya menjalankan pdfcrop dengan --verbose dan mengekstrak hasil ini:

          dan kemudian memasukkannya ke menjalankan pdfcrop kedua, menentukan kotak pembatas:

          Jika halaman terakhir bukan yang terbesar, kita perlu menghitung lebar dan tinggi maksimum di antara semua halaman, dan kemudian menggunakan nilai ini untuk menentukan kotak pembatas yang tepat. Perhatikan bahwa empat koordinat dalam kotak pembatas adalah:

          • koordinat x (jarak dari tepi kiri halaman) sudut kiri atas,
          • koordinat y (jarak dari tepi atas halaman) sudut kiri atas,
          • koordinat x (jarak dari tepi kiri halaman) pojok kanan bawah,
          • koordinat y (jarak dari tepi atas halaman) pojok kanan bawah.

          Menghitung kotak pembatas yang tepat untuk setiap halaman dan menggunakannya dapat dilakukan dengan tambalan yang sesuai untuk skrip pdfcrop (ditulis dalam Perl), tetapi karena saya tidak terlalu nyaman dengan Perl, lakukan dengan Python sebagai gantinya di sini skripnya kasus itu berguna untuk seseorang.

          Jalankan perintah pdfcrop biasa, dengan --debug , mis .:

          Karena --debug , itu tidak akan menghapus file tmp-pdfcrop-*.tex yang dibuatnya. Juga, catat perintah pdftex (atau apa pun) yang dijalankannya di akhir, jika Anda telah memasukkan beberapa opsi khusus ke pdfcrop dan karenanya tidak sepele.

          Lewati file tmp-pdfcrop-* melalui skrip di atas, mis .:

          Ini akan menulis tmp-pdfcrop-common.tex dengan kotak pembatas yang berbeda.

          Jalankan perintah pdftex (atau apa pun) yang dipanggil pdfcrop, dengan file ini:


          Generasi gambar menengah sangat kaku. image_resize() membuatnya tetap dekat dengan kode dan sama sekali tidak memiliki kait.

          Cukup banyak satu-satunya pilihan untuk ini adalah menghubungkan ke wp_generate_attachment_metadata dan menimpa gambar yang dihasilkan WP dengan milik Anda sendiri (yang akan membutuhkan sedikit garpu image_resize()).

          Saya membutuhkan ini untuk bekerja sehingga saya mungkin dapat membagikan beberapa kode nanti.

          Oke, ini contoh kasar, tetapi berfungsi. Perhatikan bahwa menyiapkan pemotongan dengan cara ini memerlukan pemahaman tentang imagecopyresampled() .

          Codex Wordpress memiliki jawabannya, di bawah ini.

          Atur ukuran gambar dengan memotong gambar dan menentukan posisi pemotongan:

          Saat mengatur posisi pemotongan, nilai pertama dalam larik adalah posisi pemotongan sumbu x, yang kedua adalah posisi pemotongan sumbu y.

          x_crop_position menerima 'kiri' 'tengah', atau 'kanan'. y_crop_position menerima 'atas', 'tengah', atau 'bawah'. Secara default, nilai-nilai ini default ke 'tengah' saat menggunakan mode hard crop.


          Augmentasi gambar untuk eksperimen machine learning.

          Pustaka python ini membantu Anda menambah gambar untuk proyek pembelajaran mesin Anda. Ini mengubah satu set gambar input menjadi set gambar baru yang jauh lebih besar dari gambar yang sedikit diubah.

          Gambar peta panas Seg. Peta Poin utama Kotak pembatas,
          poligon
          Masukan Asli
          gauss. Kebisingan
          + Kontras
          + Pertajam
          affine
          Tanaman
          + Pad
          Fliplr
          + Perspektif

          Lebih banyak contoh augmentasi (kuat) dari satu gambar input:

          • Banyak teknik augmentasi
            • Misalnya. transformasi affine, transformasi perspektif, perubahan kontras, gaussian noise, dropout region, perubahan hue/saturation, cropping/padding, blur, .
            • Dioptimalkan untuk kinerja tinggi
            • Mudah untuk menerapkan augmentasi hanya untuk beberapa gambar
            • Mudah untuk menerapkan augmentasi dalam urutan acak
              dokumentasi)
          • Peta Panas (float32), Peta Segmentasi (int), Masker (bool)
            • Mungkin lebih kecil/lebih besar dari gambar yang sesuai. Tidak baris kode tambahan yang diperlukan untuk mis. tanaman.
            • Contoh: Putar gambar dan peta segmentasi di atasnya dengan nilai yang sama yang diambil sampelnya dari uniform(-10°, 45°) . (0 baris kode tambahan.)
            • Contoh: Memutar gambar dengan nilai sampel dari uniform(-10°, 45°) .
            • Contoh: Putar gambar dengan nilai sampel dari ABS(N(0, 20.0))*(1+B(1.0, 1.0)) ", di mana ABS(.) adalah fungsi absolut, N(.) distribusi gaussian dan B( .) distribusi beta.
            • Contoh: Gambar peta panas, peta segmentasi, titik kunci, kotak pembatas, .
            • Contoh: Peta segmentasi skala, kumpulan gambar/peta rata-rata/maks, gambar pad ke rasio aspek (mis. untuk mengkuadratkannya)
            • Contoh: Konversi titik kunci ke peta jarak, ekstrak piksel dalam kotak pembatas dari gambar, klip poligon ke bidang gambar, .

            Pustaka mendukung python 2.7 dan 3.4+.

            Untuk menginstal perpustakaan di anaconda, lakukan perintah berikut:

            Anda dapat menghapus instalan perpustakaan lagi melalui conda remove imgaug .

            Kemudian instal imgaug baik melalui pypi (dapat tertinggal di belakang versi github):

            atau instal versi terbaru langsung dari github:

            Untuk menghapus perpustakaan, jalankan saja pip uninstall imgaug .

            Contoh notebook jupyter:

            Contoh halaman ReadTheDocs:

            Semua file terkait dokumentasi proyek ini di-host di repositori imgaug-doc.

            • 0.4.0: Menambahkan augmenter baru, mengubah backend menjadi augmentasi batch, dukungan untuk numpy 1.18 dan python 3.8.
            • 0.3.0: Augmentasi peta segmentasi yang dikerjakan ulang, disesuaikan dengan numpy 1.17+ API pengambilan sampel angka acak, beberapa augmenter baru.
            • 0.2.9: Menambahkan augmentasi poligon, menambahkan augmentasi string garis, antarmuka augmentasi yang disederhanakan.
            • 0.2.8: Peningkatan kinerja, dukungan dtype dan augmentasi multicore.

            Gambar di bawah ini menunjukkan contoh untuk sebagian besar teknik augmentasi.

            Nilai yang ditulis dalam bentuk (a, b) menunjukkan distribusi seragam, yaitu nilai diambil secara acak dari interval [a, b] . String baris didukung oleh (hampir) semua augmenter, tetapi tidak divisualisasikan secara eksplisit di sini.

            meta
            Identitas Acak Saluran
            Lihat juga: Sequential, SomeOf, OneOf, Terkadang, WithChannels, Lambda, AssertLambda, AssertShape, RemoveCBAsByOutOfImageFraction, ClipCBAsToImagePlanes
            hitung
            Menambahkan Menambahkan
            (per_channel=Benar)
            AditifGaussianNoise AditifGaussianNoise
            (per_channel=Benar)
            Berkembang biak
            Memotong Keluar Dropout Kasar
            (p=0,2)
            Dropout Kasar
            (p=0.2, per_channel=Benar)
            putus sekolah2d
            Garam dan merica garam kasar dan merica
            (p=0,2)
            Membalikkan Solarisasi Kompresi Jpeg
            Lihat juga: AddElementwise, AdditiveLaplaceNoise, AdditivePoissonNoise, MultiplyElementwise, TotalDropout, ReplaceElementwise, ImpulseNoise, Salt, Pepper, CoarseSalt, Coarse Pepper, Solarize
            artistik
            kartun
            mencampur
            CampuranAlpha
            dengan EdgeDetect(1.0)
            BlendAlphaSimplexNoise
            dengan EdgeDetect(1.0)
            BlendAlphaFrequencyNoise
            dengan EdgeDetect(1.0)
            BlendAlphaSomeColors
            dengan RemoveSaturation(1.0)
            BlendAlphaRegularGrid
            dengan Multiply((0.0, 0.5))
            Lihat juga: BlendAlphaMask, BlendAlphaElementwise, BlendAlphaVerticalLinearGradient, BlendAlphaHorizontalLinearGradient, BlendAlphaSegMapClassIds, BlendAlphaBoundingBoxes, BlendAlphaCheckerboard, SomeColorsMaskGen, HorizontalLinearGradientMaskMaskGen,GendenMaskGensk,GradientMaskGensken, VerticalLinear
            mengaburkan
            GaussianBlur Rata-rataBlur MedianBlur BilateralBlur
            (sigma_color=250,
            sigma_spasi=250)
            MotionBlur
            (sudut = 0)
            MotionBlur
            (k=5)
            MeanShiftBlur
            koleksi
            RandAugment
            warna
            MultiplyAndAddToBrightness MultiplyHueAndSaturation MultiplyHue MultiplySaturation TambahkanToHueAndSaturation
            skala abu-abu Hapus Saturasi UbahWarnaSuhu KMeansColorQuantization
            (to_colorspace=RGB)
            SeragamWarnaKuantisasi
            (to_colorspace=RGB)
            Lihat juga: WithColorspace, WithBrightnessChannels, MultiplyBrightness, AddToBrightness, WithHueAndSaturation, AddToHue, AddToSaturation, ChangeColorspace, Posterize
            kontras
            Kontras Gamma Kontras Gamma
            (per_channel=Benar)
            Kontras Sigmoid
            (batas = 0,5)
            Kontras Sigmoid
            (keuntungan=10)
            LogKontras
            Kontras Linier Semua Saluran-
            HistogramEqualization
            HistogramEqualization Semua SaluranCLAHE CLAHE
            Lihat juga: Menyamakan
            berbelit-belit
            Mengasah
            (alfa=1)
            Menatah
            (alfa=1)
            Deteksi Tepi DirectedEdgeDetect
            (alfa=1)
            Lihat juga: Konvolve
            debug
            Lihat juga: SaveDebugImageEveryNBatches
            tepi
            Cerdik
            Balik
            Fliplr Flipud
            Lihat juga: HorizontalFlip, VerticalFlip
            geometris
            affine Affin: Mode
            Affin: cval Sepotong-sepotongAffine
            Transformasi Perspektif Transformasi Elastis
            (sigma=1,0)
            Transformasi Elastis
            (sigma=4.0)
            Rot90
            DenganPolarWarping
            + Affin
            Gergaji ukir
            (5x5) kisi
            Lihat juga: ScaleX, ScaleY, TranslateX, TranslateY, Rotate
            imgcorruptlike
            KacaBlur DefocusBlur ZoomBlur Salju Berhamburan
            Lihat juga: GaussianNoise, ShotNoise, ImpulseNoise, SpeckleNoise, GaussianBlur, MotionBlur, Fog, Frost, Contrast, Brightness, Saturate, JpegCompression, Pixelate, ElasticTransform
            seperti pil
            Kontras otomatis Tingkatkan Warna Tingkatkan Ketajaman FilterEdgeEnhanceLainnya FilterKontur
            Lihat juga: Solarize, Posterize, Equalize, EnhanceContrast, EnhanceBrightness, FilterBlur, FilterSmooth, FilterSmoothMore, FilterEdgeEnhance, FilterFindEdges, FilterEmboss, FilterSharpen, FilterDetail, Affine
            penyatuan
            Rata-RataPengumpulan MaxPooling MinPooling Penggabungan Median
            segmentasi
            Superpiksel
            (p_ganti=1)
            Superpiksel
            (n_segmen=100)
            SeragamVoronoi RegularGridVoronoi: baris/kolom
            (p_drop_points=0)
            RegularGridVoronoi: p_drop_points
            (n_baris=n_kol=30)
            RegularGridVoronoi: p_replace
            (n_baris=n_kol=16)
            Lihat juga: Voronoi, RelativeRegularGridVoronoi, RegularGridPointsSampler, RelativeRegularGridPointsSampler, DropoutPointsSampler, UniformPointsSampler, SubsamplingPointsSampler
            ukuran
            PangkasDanPad Tanaman
            Bantalan PadToFixedUkuran
            (tinggi'=tinggi+32,
            lebar'=lebar+32)
            CropToFixedUkuran
            (tinggi'=tinggi-32,
            lebar'=lebar-32)
            Lihat juga: Resize, CropToMultiplesOf, PadToMultiplesOf, CropToPowersOf, PadToPowersOf, CropToAspectRatio, PadToAspectRatio, CropToSquare, PadToSquare, CenterCropToFixedSize, CenterPadToFixedSize, CenterCropToMultiplesOf, CenterPadToMultiplesOf, CenterCropToPowersOf, CenterPadToPowersOf, CenterCropToAspectRatio, CenterPadToAspectRatio, CenterCropToSquare, CenterPadToSquare, KeepSizeByResize
            cuaca
            Lanskap Bersalju Cepat
            (pengganda_ringan=2.0)
            awan Kabut Kepingan salju Hujan
            Lihat juga: CloudLayer, SnowflakesLayer, RainLayer

            Contoh: Pengaturan Pelatihan Sederhana

            Situasi pembelajaran mesin standar. Latih kumpulan gambar dan tingkatkan setiap kumpulan melalui pemotongan, flip horizontal ("Fliplr") dan gaussian blur:

            Contoh: Pipa Augmentasi yang Sangat Kompleks

            Terapkan pipa augmentasi yang sangat berat ke gambar (digunakan untuk membuat gambar di bagian paling atas readme ini):

            Contoh: Gambar Tambahan dan Poin Utama

            Tambahkan gambar dan titik kunci/tengara pada gambar yang sama:

            Perhatikan bahwa semua koordinat dalam imgaug adalah subpiksel-akurat, itulah sebabnya x=0,5, y=0,5 menunjukkan pusat piksel kiri atas.

            Contoh: Gambar Augment dan Kotak Pembatas

            Contoh: Gambar Augment dan Poligon

            Contoh: Augment Images dan LineStrings

            LineStrings mirip dengan poligon, tetapi tidak tertutup, dapat berpotongan dengan dirinya sendiri dan tidak memiliki area dalam.

            Contoh: Gambar Tambahan dan Peta Panas

            Heatmaps adalah array float padat dengan nilai antara 0.0 dan 1.0 . Mereka dapat digunakan mis. saat melatih model untuk memprediksi lokasi landmark wajah. Perhatikan bahwa peta panas di sini memiliki tinggi dan lebar yang lebih rendah daripada gambar. imgaug menangani kasus itu secara otomatis. Jumlah piksel pangkas akan dibagi dua untuk peta panas.

            Contoh: Gambar Augment dan Peta Segmentasi

            Ini mirip dengan peta panas, tetapi array padat memiliki dtype int32 . Operasi seperti pengubahan ukuran akan secara otomatis menggunakan interpolasi tetangga terdekat.

            Contoh: Visualisasikan Gambar yang Diperbesar

            Tunjukkan dengan cepat hasil contoh dari urutan augmentasi Anda:

            Contoh: Visualisasikan Data Non-Gambar yang Diperbesar

            imgaug berisi banyak fungsi pembantu, di antara fungsi-fungsi ini untuk memvisualisasikan hasil non-gambar dengan cepat, seperti kotak pembatas atau peta panas.

            LineStrings dan peta segmentasi mendukung metode serupa seperti yang ditunjukkan di atas.

            Contoh: Menggunakan Augmenter Hanya Sekali

            Meskipun antarmuka diadaptasi untuk penggunaan kembali instance augmenter berkali-kali, Anda juga bebas menggunakannya hanya sekali. Overhead untuk instantiate augmenter setiap kali biasanya diabaikan.

            Contoh: Augmentasi Multicore

            Jika Anda membutuhkan lebih banyak kontrol atas augmentasi latar belakang, mis. untuk menyetel seed, mengontrol jumlah core CPU yang digunakan atau membatasi penggunaan memori, lihat notebook augmentasi multicore yang sesuai atau API tentang Augmenter.pool() dan imgaug.multicore.Pool.

            Contoh: Distribusi Probabilitas sebagai Parameter

            Sebagian besar augmenter mendukung penggunaan tupel (a, b) sebagai jalan pintas untuk menunjukkan seragam (a, b) atau daftar [a, b, c] untuk menunjukkan satu set nilai yang diizinkan dari mana satu akan dipilih secara acak. Jika Anda memerlukan distribusi probabilitas yang lebih kompleks (mis. distribusi gaussians, truncated gaussians, atau poisson), Anda dapat menggunakan parameter stokastik dari imgaug.parameters :

            Ada banyak lagi distribusi probabilitas di perpustakaan, mis. distribusi gaussian terpotong, distribusi poisson atau distribusi beta.

            Terapkan augmenter hanya ke saluran gambar tertentu:

            Jika perpustakaan ini telah membantu Anda selama penelitian Anda, jangan ragu untuk mengutipnya:

            AssertionError menginstal tes untuk 0.2.9 build di NixOS

            Saya mencoba mengaktifkan kasus uji untuk pythonPackages.imgaug https://github.com/NixOS/nixpkgs/pull/67494

            Selama proses ini saya dapat menjalankan kasus uji tetapi menghadapi PernyataanError dan ini menyebabkan 5 kegagalan. Ringkasan uji coba: ============ **5 gagal, 383 lulus, 3 peringatan dalam 199,71 detik (0:03:19)** =========== ==

            Konversi dari RGB ke HSV dan sebaliknya gagal dengan OpenCV 3.x

            Saya mendapatkan kesalahan berikut setiap kali saya menjalankan kode dengan

            iaa.ChangeColorspace(from_colorspace="RGB", to_colorspace="HSV"), iaa.ChangeColorspace(from_colorspace="HSV", to_colorspace="RGB"),

            Kesalahannya adalah sebagai berikut:

            cv2.error: OpenCV(3.4.2) /io/opencv/modules/imgproc/src/color.hpp:253: error: (-215:Pernyataan gagal) VScn::contains(scn) && VDcn::contains(dcn ) && VDepth::contains(depth) dalam fungsi 'CvtHelper' mereferensikan baris ini https://github.com/aleju/imgaug/blob/1887d1e5bb2afa8ce94320f4bc7ab354753e9eda/imgaug/augmenters/color.py#L341

            Bagaimana cara meng-install??

            Ini terlihat luar biasa!! Bagaimana cara menginstal dan memanfaatkan perpustakaan ini?

            Dokumen secara rinci

            Hai, @aleju! Saya pikir pekerjaan Anda sangat bagus dan bermanfaat! Tapi menurut saya ada sedikit kesulitan dalam menggunakannya. Misalnya, pada segmen kode, "image = ia.quokka(size=(256, 256))", saya tidak menemukan spesifikasi tentang fungsi "quokka" Apakah ada dokumen tentang semua API secara detail? Anda telah memberikan alamat web, "http://imgaug.readthedocs.io/en/latest/source/modules.html - API." Tapi saya menemukan hanya ada beberapa daftar nama modul dan tidak ada penjelasan rinci tentang API.

            Saya tidak menemukan alamat web yang benar? Terima kasih sebelumnya.

            Perbaiki doctests dan pindah ke xdoctest

            Saat ini doctests imgaug tidak berjalan. Mereka mungkin tidak berjalan karena menulis dokumen yang benar itu rumit. Modul doctest Python bawaan menggunakan penguraian regex, yang memberikan banyak beban pada pengembang untuk memastikan sintaks dapat diuraikan oleh sistem berdasarkan heuristik.

            Namun, sebenarnya tidak sulit untuk menjalankan doctests. Itu sebabnya saya menulis xdoctest. Ini menggunakan parser yang sama yang digunakan oleh interpreter Python untuk secara statis (yaitu sama sekali tidak ada efek samping) mengurai file sumber Anda, mengekstrak docstrings, mengekstrak lebih lanjut doctests, dan akhirnya menyusun doctests sedemikian rupa sehingga mereka dapat dengan mudah dijalankan.

            Saya melihat basis kode Anda memiliki doctests yang sangat bagus! Namun, akan lebih baik jika mereka menjalankan dengan server CI. Saya dapat membantu bergerak ke arah ini.

            Ketika saya pertama kali menjalankan xdoctest pada basis kode Anda, saya melihat bahwa ada banyak kesalahan karena iaa tidak terdefinisi. Ini masuk akal karena doctests tidak pernah benar-benar mengimpor file-file itu (dan ketika dijalankan melalui xdoctest Anda mewarisi cakupan global file di mana doctest didefinisikan). Perbaikan yang paling kuat adalah dengan benar-benar memasukkan dari imgaug import augmenter sebagai iaa di bagian atas setiap doctest. Namun, itu akan banyak perubahan. Untungnya, karena saya penulis xdoctest, saya tahu jalan di sekitar kode dan di PR33 saya hanya memasukkan logika yang memungkinkan pengguna untuk menentukan (melalui xdoctest CLI) sedikit kode yang dieksekusi sebelum setiap doctest (saya sedang mencoba menjalankan pytorch doctests juga, dan repo itu juga memiliki masalah yang sama).

            Setelah menulis tambalan itu dan memperbaiki kesalahan iaa, jumlah dokumen yang gagal berubah dari 64 gagal menjadi 13 gagal.

            Salah satu alasan untuk menjalankan doctests adalah untuk memastikan bahwa contoh Anda selalu up to date dan memiliki sintaks yang valid. Kegagalan ini memotivasi untuk benar-benar menjalankan doctests.

            Saya dapat memperbaiki semua kesalahan di atas dengan memperbaiki bug yang sebenarnya (mis. memanggil augment_keypoints ketika Anda bermaksud augment_bounding_boxes) atau membuat perubahan kecil (seperti mendefinisikan variabel img / A ).

            Saya telah menambahkan kode yang relevan untuk mengubah pytest untuk menggunakan plugin xdoctest alih-alih doctest normal. Perhatikan bahwa saat ini tidak akan berfungsi pada travis karena saya harus merilis xdoctest versi 0.7.0 sebelum argumen --global-exec diekspos. Namun, pada mesin lokal saya yang menjalankan pytest menjalankan semua tes reguler selain doctests.

            Perhatikan juga ini didasarkan pada trunc normal PR saya (yang merupakan alasan saya ingin xdoctest dijalankan di tempat pertama), jadi github menunjukkan sedikit lebih banyak perbedaan daripada yang sebenarnya.

            EDIT: Saya mendorong xdoctest versi 0.7.0 ke pypi, jadi mungkin untuk menjalankannya di TravisCI atau CircleCI.


            1 Jawaban 1

            masalah ini kemungkinan tidak dapat diselesaikan, maaf :)

            Katakanlah Anda mencari maksimum global dalam kotak dengan panjang 1 dan dimensi $m=100$ . Selanjutnya, mari kita asumsikan bahwa Anda mengetahui nilai maksimum $F_$ , Anda hanya tidak tahu di mana itu. Mari kita asumsikan juga bahwa nilai absolut dari semua turunan $| abla F|$ dibatasi oleh beberapa angka $D$ . Setiap kali Anda mengambil sampel satu titik dari fungsi, Anda mendapatkan informasi tentang apakah maksimum mungkin terletak di dalam tambalan tertentu yang dilokalkan di sekitar titik sampel. Ukuran dan bentuk patch yang tepat akan bergantung pada nilai fungsi, nilai gradien, dan $D$ . Masalahnya, Anda tidak mendapatkan informasi apa pun tentang apa yang terjadi di luar patch itu. Jadi, untuk menjamin pencarian yang maksimal, Anda harus memiliki tambalan yang cukup untuk menutupi seluruh volume kubus.Jumlah tambalan yang Anda butuhkan bertambah secara eksponensial dengan dimensi, jadi meskipun Anda membutuhkan 2 tambalan per dimensi, Anda masih membutuhkan tambalan $2^ <100>kira-kira 10^<30>$, yang tidak dapat dihitung pada perangkat keras biasa. Kekhawatiran lebih lanjut:


            Ukuran logo yang cocok [duplikat]

            Saat Anda mendesain dokumen dan Anda harus menempatkan banyak dukungan logo dalam dokumen, bagaimana Anda membuat semua logo tampak berukuran sama?

            Apakah ada cara yang lebih matematis atau ilmiah untuk mencocokkan ukuran logo selain menggunakan mata Anda?

            Saya sedang mempertimbangkan untuk menggunakan ukuran area setiap logo, tetapi Adobe Illustrator tidak memiliki cara untuk mengubah ukuran logo sesuai dengan ukuran areanya, Anda hanya dapat mengubah ukuran logo sesuai dengan dimensi lebar atau tingginya. Ukuran area yang sebenarnya harus dihitung dan menjadi berantakan dan rumit.