URL (Uniform Resource Locator) คือ “ที่อยู่ของทรัพยากรบนเว็บ” หรือที่เรียกกันว่า “เว็บแอดเดรส (Web Address)” เป็นสิ่งที่บอกตำแหน่งของหน้าเว็บหรือไฟล์ใด ๆ บนอินเทอร์เน็ต
ผู้ใช้ส่วนใหญ่จะพิมพ์ ชื่อโดเมน (domain name) เช่น hostatom.com แทน Internet Protocol (IP) เช่น 192.68.20.50 เพราะชื่อจำง่ายกว่าตัวเลขยาว ๆ
โครงสร้างของ URL
เมื่อเว็บเบราว์เซอร์ร้องขอหน้าเว็บจากเซิร์ฟเวอร์
จะใช้ URL เป็นที่อยู่ของเอกสารหรือข้อมูลที่ต้องการ
scheme://prefix.domain:port/path/filename
คำอธิบาย
- scheme ประเภทของบริการอินเทอร์เน็ต เช่น http หรือ https
- prefix คำนำหน้าชื่อโดเมน (เช่น www)
- domain ชื่อโดเมน เช่น hostatom.com
- port หมายเลขพอร์ตของเซิร์ฟเวอร์ (ค่าเริ่มต้นของ http คือ 80)
- path เส้นทางภายในเซิร์ฟเวอร์ (ถ้าไม่ระบุ หมายถึงโฟลเดอร์หลักของเว็บไซต์)
- filename ชื่อไฟล์หรือทรัพยากรที่ต้องการ
URL Schemes
| Scheme | ย่อมาจาก | ใช้กับ |
|---|---|---|
| http | HyperText Transfer Protocol | เว็บเพจทั่วไป ที่ไม่มีการเข้ารหัส |
| https | Secure HyperText Transfer Protocol | เว็บเพจที่ต้องการความปลอดภัย เข้ารหัส |
| ftp | File Transfer Protocol | ใช้สำหรับ Download หรือ Upload ไฟล์ |
| file | เปิดไฟล์บนคอมพิวเตอร์ของคุณ |
URL Encoding
URL จะถูกส่งผ่านอินเทอร์เน็ตโดยใช้ชุดอักขระ ASCII เท่านั้น
ดังนั้นหาก URL มีอักขระที่อยู่นอกชุด ASCII (เช่น อักขระภาษาไทย หรืออักขระพิเศษ)
ระบบจำเป็นต้องแปลงก่อนส่ง เรียกว่า URL Encoding
หลักการแปลง
- URL Encoding จะแทนที่อักขระพิเศษด้วยเครื่องหมาย
%ตามด้วย เลขฐาน 16 (Hexadecimal) - ไม่สามารถมี “ช่องว่าง (space)” ใน URL ได้ ช่องว่างจะถูกแทนด้วย เครื่องหมายบวก (+) หรือ
%20
ตัวอย่างการเข้ารหัส ASCII
เบราว์เซอร์จะเข้ารหัสข้อความตาม character set ของหน้าเว็บ (โดยทั่วไปคือ UTF-8)
| Character | จาก Windows-1252 | จาก UTF-8 |
|---|---|---|
| € | %80 | %E2%82%AC |
| £ | %A3 | %C2%A3 |
| © | %A9 | %C2%A9 |
| ® | %AE | %C2%AE |
| À | %C0 | %C3%80 |
| Á | %C1 | %C3%81 |
| Â | %C2 | %C3%82 |
| Ã | %C3 | %C3%83 |
| Ä | %C4 | %C3%84 |
| Å | %C5 | %C3%85 |