Codificação de caracteres
Uma codificação de caracteres é um padrão de relacionamento entre um conjunto de caracteres (representações de grafemas ou unidades similares a grafemas como as que compõem um alfabeto ou silabário utilizados na comunicação através de uma linguagem natural) com um conjunto de outra coisa, como por exemplo números ou pulsos elétricos com o objetivo de facilitar o armazenamento de texto em computadores e sua transmissão através de redes de telecomunicação.[1] Exemplos comuns são o código Morse que codifica as letras do alfabeto latino e os numerais como seqüências de pulsos elétricos de longa e curta duração e também o ASCII que codifica os mesmos grafemas do código Morse além de outros símbolos através de números inteiros e da representação binária em sete bits destes mesmos números.
Convencionalmente, conjunto de caracteres e codificação de caracteres eram considerados sinônimos, já que o mesmo nome poderia especificar tanto quais caracteres estão disponíveis e como eles foram codificados em um fluxo de unidades de código (normalmente com um único caractere por unidade de código). No entanto, o Unicode afastou essa ideia, separando a ideia de numerar uma série de caracteres de codificar esses caracteres em um fluxo de unidades de código. Para manter as nomenclaturas históricas e os sistemas baseados nelas, usa-se o termo charset para se referir a uma codificação de caracteres.
Repertório de caracteres
[editar | editar código-fonte]Em alguns contextos, especialmente na comunicação e armazenamento computacional, faz sentido a distinção entre um repertório de caracteres (um conjunto completo de caracteres abstratos que um sistema suporta) e um conjunto de caracteres codificados ou codificação de caracteres (que detalha como representar caracteres deste conjunto usando códigos inteiros).
Nos primórdios da computação, a introdução de repertórios de caracteres tais como o ASCII (1963) e o EBCDIC (1964) deu início ao processo de padronização. As limitações de tais conjuntos logo mostrou-se aparente, e uma quantidade de métodos ad hoc foram desenvolvidos para estendê-los. A necessidade de suportar múltiplos sistemas de escrita, incluindo a família CJK dos caracteres leste-asiáticos, exigia suporte a um número bem maior de caracteres e demandava uma abordagem sistemática diferente das anteriores para a codificação de caracteres.
Por exemplo, o repertório completo do Unicode compreende mais de cem mil caracteres. Cada um destes caracteres possui um código inteiro único no intervalo de 0 a 10FFFF hexadecimal (pouco acima de 1,1 milhão, embora nem todos os inteiros neste intervalo representem caracteres). Outros repertórios comuns incluem o ASCII e o ISO 8859-1 que espelham, respectivamente, os primeiros 128 e 256 caracteres do Unicode.
Código Morse
[editar | editar código-fonte]O Código Morse é um método de telecomunicação que codifica símbolos de texto em sequências padronizadas de dois sinais de duração diferente, chamados de pontos e traços.[2][3][4] O Código Morse foi nomeado em homenagem a Samuel Morse, um dos primeiros desenvolvedores do sistema adotado para o telégrafo elétrico.
O Código Morse Internacional codifica 26 letras básicas do alfabeto latino de A a Z, uma letra latina com acento (É), números árabes e um pequeno conjunto de sinais de pontuação e sinais procedurais (prosinais).[5][6] Não há distinção entre letras maiúsculas e minúsculas. Cada símbolo do alfabeto Morse é formado por uma sequência de pontos e traços. A duração de um ponto pode variar dependendo da clareza do sinal e da habilidade do operador, mas para qualquer mensagem, uma vez que o ritmo é estabelecido, o meio tempo é a unidade básica de medição de tempo no código Morse. A duração de um traço é três vezes a duração de um ponto (embora alguns telegrafistas exagerem intencionalmente o comprimento do traço para uma sinalização mais clara). Após cada ponto ou traço no símbolo codificado, segue-se um período de ausência de sinal, chamado de espaço, igual à duração de um ponto. As letras de uma palavra são separadas por um espaço de três pontos, e as palavras são separadas por um espaço de sete pontos.[7]
O tradutor de Código Morse permite que qualquer pessoa traduza texto em Código Morse ou converta Código Morse em texto.[8]
O Código Morse pode ser memorizado e transmitido em uma forma perceptível pelos sentidos humanos, como ondas sonoras ou luz visível, de modo que pode ser interpretado diretamente por pessoas treinadas nessa habilidade.[9] O Código Morse é geralmente transmitido através da ligação e desligamento de um meio de informação, como corrente elétrica, ondas de rádio, luz visível ou ondas sonoras. A corrente ou onda está presente durante o período de tempo do ponto ou traço e ausente durante o tempo entre pontos e traços.
Codificação de caracteres populares
[editar | editar código-fonte]- ISO 646
- EBCDIC
- ISO 8859:
- Conjunto de caracteres do DOS, também conhecida como página de código IBM:
- Conjunto de caracteres Windows:
- Windows-1250
- Windows-1251 para alfabeto Cirílico
- Windows-1252
- Windows-1253
- Windows-1254
- Windows-1255 para o Hebreu
- Windows-1256 para o Arábico
- Windows-1257
- Windows-1258 para o Vietnamita
- KOI8-R, KOI8-U, KOI7
- ISCII
- VISCII
- Big5
- Guobiao
- ISO 2022, Shift-JIS, EUC
- Unicode (e subconjuntos)
- ABICOMP
- BRASCII
Ver também
[editar | editar código-fonte]- Mojibake — Erro no mapeamento de um conjunto de caracteres.
Referências
- ↑ Tom Jennings (1 de março de 2010). «An annotated history of some character codes» (em inglês). Consultado em 1 de novembro de 2018
- ↑ «Solved Exercise 5: Morse Code Encoder Morse code is a method». www.chegg.com. Consultado em 5 de junho de 2025
- ↑ «County Connections: Morse Code Day». www.co.cook.mn.us. Consultado em 5 de junho de 2025
- ↑ «Technologies, Communications and Codes, International Morse Code». collectionswa.net.au. Consultado em 5 de junho de 2025
- ↑ «Morse Code». darts.org.in. Consultado em 5 de junho de 2025
- ↑ «Resource - Exercise - Morse Code Activity». www.iwakuroleplay.com. Consultado em 5 de junho de 2025
- ↑ «Telegraph Regulations (1949 : Paris, France)» (PDF). search.itu.int. Consultado em 5 de junho de 2025
- ↑ «Morsekodsöversättare». morsecodetranslator.com. Consultado em 5 de junho de 2025
- ↑ «TM 11-459. International Morse Code (Instructions)». archive.org. Consultado em 5 de junho de 2025