Binary ↔ teksto converter — UTF-8 at ASCII

I-convert ang teksto patungong binary at pabalik sa browser, may UTF-8 at ASCII na suporta.

Mga karakter: 7 Mga UTF-8 byte: 7 Haba ng output: 63
Mabilisang reperensiya: karaniwang ASCII characters sa 8-bit binary
Karakter Decimal Binary (8 bits)
A6501000001
Z9001011010
a9701100001
z12201111010
04800110000
95700111001
(espasyo)3200100000
!3300100001
?6300111111
(bagong linya)1000001010

Mga madalas itanong

Paano gumagana ang text-to-binary conversion?
Bawat karakter sa teksto ay may numeric code (ang code point nito). Para sa ASCII characters, kasya ang code sa 7 bits at pinupunan ng nangungunang zero para maging 8. Ang karakter na A ay code 65, na 01000001 sa binary. Binabasa ng converter ang bawat karakter, hinahanap ang code, at isinusulat ang binary representation byte by byte.
Ano ang pagkakaiba ng ASCII at UTF-8?
Sumasaklaw ang ASCII sa 128 characters (mga letra ng Ingles, numero, bantas) at gumagamit ng isang 7-bit byte bawat karakter. Ang UTF-8 ay variable-length encoding na kayang hawakan ang lahat ng karakter sa mundo — Latin, Cyrillic, Tsino, Arabic, emoji — gamit ang isa hanggang apat na bytes bawat karakter. Pareho ang ASCII characters sa UTF-8 (isang byte). Ang mga Tagalog na may diin tulad ng é sa "café" ay nangangailangan ng UTF-8 (dalawang bytes), pati na rin ang emoji. Gamitin ang UTF-8 maliban kung talagang kailangan ng ASCII compatibility para sa lumang sistema.
Bakit nabigo ang pag-decode ng aking binary?
Mga karaniwang dahilan: (1) hindi 8 (o 7) bits ang bawat bit group — tingnan kung walang sobrang espasyo; (2) may mga karakter bukod sa 0 at 1; (3) ang binary ay kumakatawan sa hindi kumpletong UTF-8 sequence. Inire-report ng decoder ang posisyon ng unang error para maayos mo. Kung walang separator ang input, itakda ang "Pagpapangkat ng bit" sa 8 at "Tagahiwalay" sa Wala.
Ilang bits bawat character ang dapat gamitin?
Ang karaniwang convention ay 8 bits bawat byte. Kasya ang puro ASCII sa 7 bits, ngunit ang naka-store na data at network protocols ay laging pinupunan hanggang 8. Gamitin ang 7-bit lamang kapag nagtatrabaho sa mga lumang teletype protocol o academic exercise sa BSCS o ICT subject. Ang mga karakter na hindi ASCII (mga Tagalog na may diin gaya ng ñ sa "Filipiniana", emoji, Tsino) ay nangangailangan ng multi-byte UTF-8, kaya hindi applicable ang 7-bit grouping sa kanila.
Pwede ba akong mag-convert ng Tagalog text o emoji?
Oo — panatilihing UTF-8 ang encoding. Karamihan ng mga letra sa Tagalog (a-z, A-Z) ay kasya sa ASCII at isang byte lamang. Ang mga karakter na may diin tulad ng ñ (sa "Año", "señor") at é ay dalawang bytes. Halimbawa: ang emoji na puso ay apat na bytes (11110000 10011111 10010010 10100110). Ang mga Tsinong karakter na minsang ginagamit sa pangalan ay tatlong bytes. Tinatanggihan ng ASCII mode ang anumang karakter sa labas ng 0-127 range nang may error.
Pareho ba ang binary at machine code?
Hindi. Ang binary ay numeric base lamang — base 2 — na gumagamit ng dalawang digit, 0 at 1. Ang machine code ay binary representation ng mga CPU instruction, na specific encoding para sa specific processor. Ang binary na nakikita mo dito ay teksto na naka-encode bilang bytes, hindi mga executable instruction. Pareho silang gumagamit ng 0 at 1, kaya naman colloquial na "binary" ang ibig sabihin ng "computer-friendly" sa mga coding bootcamp at klase sa unibersidad.
Paano i-convert pabalik ang binary sa text?
Lumipat sa Binary → Teksto tab at i-paste ang binary mo. Hinahati ng decoder ang input ayon sa separator (default: espasyo) sa mga byte, kino-convert ang bawat group mula base 2 patungo sa decimal code point, at tinitipon ang resulta. Para sa UTF-8, tama nitong pinagsasama-sama ang multi-byte sequence pabalik sa isang karakter.
Lahat ng conversion ay nangyayari sa iyong browser. Walang ina-upload.

Ginagawang binary ang anumang teksto at pabalik sa browser nang walang kailangang i-upload sa server. Pumipili ka ng UTF-8 (para sa Tagalog na may diin gaya ng ñ sa Año o emoji) o ASCII (para sa lumang sistema), itinatakda ang bit grouping (8 o 7 bits) at separator (espasyo, gitling, pipe o wala). Halimbawa: ang Kamusta sa UTF-8 ay 7 bytes, ang puso emoji ay 4 bytes, ang Filipiniana ay 11 bytes dahil sa ñ. Praktikal para sa estudyante ng BSCS sa UP o Ateneo, sa mga coding bootcamp sa Maynila o Cebu, sa K-12 ICT subject, at sa pagsusuri ng network protocol o character encoding.