Процес перетворення даних з однієї форми в іншу відомий як кодування. Він використовується для перетворення даних, щоб дані могли підтримуватися та використовуватися різними системами. Кодування працює подібно до перетворення температури за Цельсієм у Фаренгейт, оскільки вона просто перетворюється в іншу форму, але вихідне значення завжди залишається незмінним. Кодування використовується в основному в двох областях:
Примітка. Кодування відрізняється від шифрування, оскільки його основна мета полягає не в тому, щоб приховати дані, а в тому, щоб перетворити їх у формат, щоб їх можна було належним чином використовувати.
У цій темі ми збираємося обговорити різні типи методів кодування, які використовуються в обчисленнях.
Тип техніки кодування
Кодування символів
Кодування символів кодує символи в байти . Він інформує комп’ютери про те, як інтерпретувати нуль і одиниці в справжні символи, числа та символи. Комп'ютер розуміє тільки двійкові дані; отже, необхідно перетворити ці символи в цифрові коди. Для цього кожен символ перетворюється на двійковий код, і для цього текстові документи зберігаються з типами кодування. Це можна зробити, поєднавши числа з символами. Якщо ми не застосовуємо кодування символів, наш веб-сайт не відображатиме символи та текст у належному форматі. Таким чином, це зменшить читабельність, і машина не зможе правильно обробляти дані. Крім того, кодування символів забезпечує належне представлення кожного символу в комп’ютерному чи двійковому форматі.
Існують різні типи методів кодування символів, які наведено нижче:
Кодування HTML
Кодування HTML використовується для відображення сторінки HTML у належному форматі. За допомогою кодування веб-браузер дізнається, який набір символів використовувати.
У HTML у розмітці HTML використовуються різні символи, наприклад . Щоб закодувати ці символи як вміст, нам потрібно використовувати кодування.
Кодування URL
Використовується кодування URL-адреси (уніфікований покажчик ресурсу). конвертувати символи в такий формат, щоб їх можна було передавати через Інтернет . Він також відомий як процентне кодування. Кодування URL-адреси виконується для надсилання URL-адреси в Інтернет за допомогою набору символів ASCII. Символи, відмінні від ASCII, замінюються на %, за якими йдуть шістнадцяткові цифри.
Кодування UNICODE
Unicode — це стандарт кодування для універсального набору символів. Він дозволяє кодувати, представляти та обробляти текст, представлений більшістю мов або систем письма, доступних у всьому світі. Він надає кодову точку або номер для кожного символу в кожній підтримуваній мові. Він може представляти приблизно всі можливі символи в усіх мовах. Певна послідовність бітів відома як одиниця кодування.
Стандарт UNICODE може використовувати 8, 16 або 32 біти для представлення символів.
Стандарт Unicode визначає формат перетворення Unicode (UTF) для кодування кодових точок.
Стандарт кодування UNICODE має наступні схеми UTF:
UTF8 визначається стандартом UNICODE, який є кодуванням символів змінної ширини, що використовується в електронному зв’язку. UTF-8 здатний кодувати всі 1 112 064 дійсні кодові точки символів у Unicode, використовуючи від одного до чотирьох однобайтових (8-бітних) одиниць коду.
Кодування UTF16 представляє кодові точки символу за допомогою одного з двох 16-бітних цілих чисел.
Кодування UTF32 представляє кожну кодову точку як 32-розрядні цілі числа.
Кодування Base64
Кодування Base64 використовується для кодування двійкових даних у еквівалентні символи ASCII. Кодування Base64 використовується в системі Mail, оскільки поштові системи, такі як SMTP, не можуть працювати з двійковими даними, оскільки вони приймають лише текстові дані ASCII. Він також використовується в простій автентифікації HTTP для кодування облікових даних. Крім того, він також використовується для передачі двійкових даних у файли cookie та інших параметрів, щоб зробити дані нечитабельними для запобігання підробці. Якщо зображення або інший файл передано без кодування Base64, він буде пошкоджений, оскільки поштова система не може працювати з двійковими даними.
Base64 представляє дані в блоках по 3 байти, де кожен байт містить 8 біт; отже, він представляє 24 біти. Ці 24 біти розділені на чотири групи по 6 бітів. Кожна з цих груп або фрагментів перетворюється на еквівалентне значення Base64.
Кодування ASCII
Американський стандартний код для обміну інформацією (ASCII) – це тип кодування символів. Це був перший стандарт кодування символів, випущений у 1963 році.
Код ASCII використовується для представлення англійських символів у вигляді чисел, де кожній літері присвоюється номер від 0 до 127. Більшість сучасних схем кодування символів засновані на ASCII, хоча вони підтримують багато додаткових символів. Це однобайтове кодування лише з використанням нижніх 7 бітів. У файлі ASCII кожен алфавітний, цифровий або спеціальний символ представлений 7-розрядним двійковим числом. Кожен символ клавіатури має еквівалентне значення ASCII.
Кодування зображення та аудіо та відео
Зображення, аудіо та відео кодуються для економії місця для зберігання. Медіафайли, такі як зображення, аудіо та відео, кодуються, щоб зберегти їх у більш ефективному та стисненому форматі.
Ці закодовані файли містять однаковий вміст із зазвичай однаковою якістю, але в стисненому розмірі, тож їх можна зберігати на меншому просторі, легко передавати поштою або завантажувати в систему.
Ми можемо зрозуміти це як . Аудіофайл WAV перетворюється на файл .MP3, щоб зменшити розмір на 1/10тисдо початкового розміру.