อักขระที่มองไม่เห็นในข้อความ - วิธีค้นหาและลบ Unicode ที่ซ่อนอยู่
เรียนรู้เกี่ยวกับอักขระ Unicode ที่มองไม่เห็น เช่น ช่องว่างความกว้างศูนย์ ตัวทำเครื่องหมาย BOM และยัติภังค์อ่อน ค้นพบว่ามันมาจากไหนและจะตรวจจับได้อย่างไร
อักขระที่มองไม่เห็นคืออะไร?
อักขระที่มองไม่เห็นคือจุดรหัส Unicode ที่ครอบครองพื้นที่ในสตริงข้อความแต่ไม่สร้างผลลัพธ์ที่มองเห็นได้บนหน้าจอ ต่างจากช่องว่างปกติหรือเครื่องหมายวรรคตอน อักขระเหล่านี้ถูกซ่อนไว้อย่างสมบูรณ์ ทำให้ตรวจจับด้วยตาเปล่าได้ยากมาก พวกมันมีอยู่ในไฟล์ข้อความ โค้ด ฐานข้อมูล และเนื้อหาเว็บของคุณ โดยมักจะไม่มีใครรู้
อักขระที่มองไม่เห็นที่พบบ่อยที่ควรรู้จัก
| อักขระ | Unicode | ชื่อ | จุดประสงค์ |
|---|---|---|---|
​ | U+200B | ช่องว่างความกว้างศูนย์ | อนุญาตให้ตัดบรรทัดโดยไม่มีช่องว่างที่มองเห็น |
 | U+FEFF | เครื่องหมายลำดับไบต์ (BOM) | ระบุลำดับไบต์ในไฟล์ UTF-16 |
­ | U+00AD | ยัติภังค์อ่อน | แนะนำจุดแบ่งพยางค์ที่เป็นทางเลือก |
  | U+00A0 | ช่องว่างแบบไม่ตัดคำ | ป้องกันการตัดบรรทัดระหว่างคำ |
‌ | U+200C | ตัวไม่เชื่อมความกว้างศูนย์ | ป้องกันการสร้างอักษรควบ |
‍ | U+200D | ตัวเชื่อมความกว้างศูนย์ | บังคับการเชื่อมอักษรควบหรืออิโมจิ |
⁠ | U+2060 | ตัวเชื่อมคำ | ป้องกันการตัดบรรทัดโดยไม่เพิ่มช่องว่าง |
อักขระที่มองไม่เห็นมาจากไหน?
- คัดลอกและวางจากเว็บไซต์: หน้าเว็บมีช่องว่างความกว้างศูนย์และอักขระจัดรูปแบบใน HTML ที่ถูกคัดลอกมาอย่างเงียบๆ
- โปรแกรมประมวลผลคำ: Microsoft Word, Google Docs และโปรแกรมแก้ไขอื่นๆ แทรกอักขระจัดรูปแบบที่มองไม่เห็น เช่น ยัติภังค์อ่อนและช่องว่างแบบไม่ตัดคำ
- เอกสาร PDF: ข้อความที่สกัดจาก PDF มักมีอักขระที่มองไม่เห็นที่ใช้สำหรับการจัดตำแหน่งข้อความ
- ระบบปฏิบัติการที่ต่างกัน: Windows, macOS และ Linux จัดการการสิ้นสุดบรรทัดและการเข้ารหัสข้อความแตกต่างกัน
ปัญหาจริงที่เกิดจากอักขระที่มองไม่เห็น
1. โค้ดเสียหายและข้อผิดพลาดทางไวยากรณ์
ช่องว่างความกว้างศูนย์ในชื่อตัวแปรจะทำให้เกิดข้อผิดพลาดในการคอมไพล์พร้อมข้อความที่เข้าใจยาก โค้ดดูสมบูรณ์แบบด้วยสายตา แต่คอมไพเลอร์เห็นอักขระที่ไม่คาดคิด
2. การเปรียบเทียบสตริงที่ล้มเหลว
สตริงสองตัวที่ดูเหมือนกันบนหน้าจออาจล้มเหลวในการตรวจสอบความเท่าเทียมกันหากตัวหนึ่งมีอักขระที่มองไม่เห็น
วิธีใช้เครื่องมือตรวจจับของเรา
- วางข้อความของคุณ: คัดลอกข้อความที่น่าสงสัยและวางลงในช่องป้อนข้อมูลของเครื่องมือตรวจจับ
- คลิกตรวจจับ: เครื่องมือจะสแกนอักขระทุกตัวทันทีและเน้นอักขระ Unicode ที่ซ่อนอยู่ที่พบ
- ตรวจสอบผลลัพธ์: อักขระที่มองไม่เห็นแต่ละตัวจะถูกระบุด้วยจุดรหัส Unicode ชื่อ และตำแหน่ง
- ทำความสะอาดข้อความ: ลบอักขระที่มองไม่เห็นทั้งหมดที่ตรวจพบด้วยคลิกเดียว
ลองใช้เครื่องมือตรวจจับอักขระที่มองไม่เห็น
สแกนข้อความของคุณเพื่อค้นหาอักขระ Unicode ที่ซ่อนอยู่ทันทีด้วยเครื่องมือออนไลน์ฟรีของเรา ไม่ต้องสมัครสมาชิก