Konverter Homoglif dan Karakter Membingungkan

Konverter Homoglif — Deteksi dan Bersihkan Unicode

Konversi adalah upaya terbaik: kebingungan yang dipetakan dan pelipatan NFKC bersifat deterministik, tetapi beberapa Unicode yang sah tidak akan ditandai.

Teks Anda

Tempel atau ketik — hasil diperbarui saat Anda mengetik (sedikit di-debounce untuk input yang panjang).

0 karakter dipindai
0 mencurigakan
Pertahankan Unicode yang Dapat Dibaca
Modus konversi
Asli (karakter mencurigakan ditandai)

Karakter mencurigakan dalam tampilan asli digarisbawahi dan diberi label “susp.” selain menonjolkan warna.

Keluaran yang dibersihkan
Analisis karakter

Belum ada karakter untuk dianalisis. Tempelkan teks di atas untuk melihat pengelompokan homoglif dan kebingungan.

Deteksi karakter Unicode yang membingungkan secara visual dan ubah ke ASCII yang lebih aman atau Unicode yang dinormalisasi. Gratis di browser.

Apa yang dilakukan konverter homoglif ini

Konverter homoglyph mendeteksi karakter Unicode yang terlihat seperti huruf atau angka Latin biasa (dapat membingungkan) dan menunjukkan bagaimana karakter tersebut dinormalisasi atau diganti. Anda juga dapat menjalankan Hasilkan homoglif untuk membuat string mirip spoof deterministik dari ASCII biasa untuk pengujian. Pengonversi kebingungan gratis dan pemeriksa kebingungan unicode ini berjalan sepenuhnya di browser Anda—gunakan sebagai alat normalisasi unicode, pembersih teks spoof, atau pengonversi karakter serupa untuk keamanan dan moderasi.

Cara menggunakan alat normalisasi unicode ini

  1. Tempel atau ketik teks yang ingin Anda periksa di area masukan.
  2. Pilih Pertahankan Unicode yang Dapat Dibaca, Penggantian ASCII Ketat, atau Hasilkan homoglif bergantung pada apakah Anda membersihkan teks yang ditempel atau membuat sampel pengujian dari ASCII.
  3. Bandingkan dokumen asli (dengan highlight) dan keluaran secara berdampingan; tinjau tabel analisis untuk poin kode dan alasannya.
  4. Gunakan Salin teks keluaran untuk menyalin hasilnya, atau Hapus untuk mengatur ulang.

Mode konversi: Unicode vs unicode yang dapat dibaca ke ASCII vs hasilkan

  • Preserve Readable Unicode menerapkan peta membingungkan yang dibundel terlebih dahulu, kemudian normalisasi NFKC saat mengubah karakter. Keluaran mungkin masih berisi huruf non-ASCII yang tidak ditandai.
  • Fallback ASCII yang ketat menggunakan aturan deteksi yang sama tetapi lebih memilih penggantian ASCII dari peta. Karakter yang tidak ada di peta tetap apa adanya kecuali NFKC mengubahnya; mode ini lebih ketat dan lebih baik untuk alur kerja pembersih teks spoof.
  • Hasilkan homoglif dengan menelusuri masukan Anda dari kiri ke kanan dan mengganti setiap huruf atau angka ASCII dengan satu homoglif deterministik dari paket peta yang sama (kebalikan dari pembersihan). Karakter tanpa pengganti yang dipilih tetap menjadi ASCII.

Yang dianggap mencurigakan di sini

Dalam mode pembersihan, karakter ditandai ketika karakter tersebut diketahui membingungkan dengan pengganti yang ditentukan, atau ketika normalisasi NFKC mengubahnya (misalnya digit lebar penuh). Dalam mode pembangkitan, tanda “mencurigakan” menandai setiap posisi di mana huruf atau angka ASCII diganti. Ini bukan audit keamanan unicode penuh—hanya aturan deterministik.

Kasus penggunaan umum

  • Memeriksa nama pengguna, domain, atau serangan homoglif palsu pada string yang ditempel.
  • Tinjauan moderasi dan kepercayaan dan keamanan atas trik karakter yang mirip.
  • Proses debug pengembang terhadap masalah pengkodean di samping tampilan detektor homoglif.

Batasan dan catatan keamanan

Peta yang dibundel mencakup kemiripan umum dalam Sirilik, Yunani, dan lebar penuh—tidak semua Unicode dapat membingungkan. Mode Hasilkan hanya untuk pengujian resmi; jangan menggunakannya untuk menipu orang atau melewati perlindungan. Hasilnya bersifat deterministik, bukan skor risiko berbasis ML. Selalu gabungkan dengan tinjauan manusia untuk mengambil keputusan berisiko tinggi.

Privasi

Semua deteksi dan konversi dijalankan secara lokal di JavaScript setelah halaman dimuat. Tidak ada teks yang dikirim ke server untuk diproses.

Pertanyaan yang Sering Diajukan

Apa itu homoglif?

Homoglif adalah karakter yang terlihat seperti karakter lain dari skrip atau pengkodean berbeda, seperti huruf Sirilik “а” yang menyerupai bahasa Latin “a”. Penyerang menggunakannya dalam domain, nama pengguna, dan pesan palsu. Alat ini menampilkan karakter tersebut dengan titik kode dan penggantinya.

Apa bedanya dengan normalisasi Unicode?

Normalisasi Unicode (misalnya NFKC) melipatgandakan kompatibilitas dan varian lebar dengan cara standar. Alat ini menggabungkan NFKC dengan peta kecil eksplisit yang dapat membingungkan sehingga Anda dapat melihat alasan setiap karakter ditandai—berguna selain dari alat normalisasi unicode biasa.

Apakah mode ASCII yang ketat akan mengubah teks non-Inggris yang sah?

Penggantian ASCII yang ketat menggantikan karakter yang muncul di peta yang dapat membingungkan atau berubah di bawah NFKC. Huruf non-ASCII lainnya tidak diubah. Teks yang sah masih dapat berubah jika berisi karakter yang dipetakan tersebut, jadi tinjau daftar analisisnya.

Apakah teks saya dikirim ke server?

Tidak. Setelah halaman dimuat, deteksi dan konversi hanya menggunakan JavaScript. Konverter confusables ini tidak mengunggah teks yang Anda tempel untuk dianalisis.

Bisakah ini menangkap setiap spoof?

Tidak. Cakupan bersifat deterministik dan berbasis peta, bukan pembelajaran mesin. Ini membantu dengan trik karakter umum yang mirip tetapi bukan audit keamanan penuh.

Apa yang dilakukan mode Hasilkan homoglif?

Ini menggantikan huruf dan angka ASCII dalam masukan Anda dengan kemiripan deterministik dari paket peta yang sama yang digunakan untuk pembersihan—berguna untuk membuat string pengujian di lingkungan resmi (misalnya QA moderasi). Ini bukan untuk meniru identitas atau mengabaikan perlindungan.