Перебор всех спецсимволов и их ввод

Как вводить спецсимволы (иероглифы, другие знаки) в код HTML

Код можно ввести десятичными цифрами и шестнадцатеричными, причём шестнадцатеричный код соответствует кодировке UTF-8. Собственно код десятичный численно равный шестнадцатеричному представлению это тот же UTF-8.

В десятичном исчислении код вводится, так же как и мнемоника, но после "&" добавляется "#", общий вид кода: "⭧"

В шестнадцатеричном представлении после «&#» добавляется «x», и общий вид становится "꾁"

↑ ↑ ↑ Со страницы "Мнемоники, спецсимволы и коды к ним в HTML"

Перебор всех символов HTML с сортировкой по назначению

Тема возникла из собственного эксперимента. Как-то вставляя в код страницы стрелочку "←", код ← задумался, а что ещё можно вставить в страницу без использования графики. Подбор цифр не давал полной картины, и пришлось автоматизировать процесс, использов возможности Exel (Позже появилась страница → Генератор символов HTML и UTF-8).

Сначала опробовал диапазон до 12000, даже показалось, что это все символы, но не тут-то было. Что бы перебрать всё получившееся, пришлось материал разложить на семь страниц и найти хоть какое-нибудь описание результата.

В итоге материал по простому перебору символов расположился страницах:
Перебор всех спецсимволов и их ввод
Перебор кодов всех символов HTML с 1 по 10999
Символы с 12000 по 25999. Унифицированные иероглифы ККЯ
Иероглифы ККЯ (Китай, Корея, Япония) с 26000 до 32999
Иероглифы ККЯ (Китай, Корея, Япония) c 33000-40999
Иероглифы, слоги Хангыль. Корея 44000 - 50999
Остаток Хангыль. Совместимые ККЯ. Формы арабских 51000 - 65535

Все страницы получились очень объёмными, поэтому, извините, грузятся долго и если хотите их увидеть, имейте терпение.

Большое количество символов не отображается ни одним из браузеров, но, тем не менее, в юникоде (UTF-8) их номера распределены по группам. Так как кодировка UTF-8 и коды символов связаны, то можно отсортировать их по назначению.

Сортировка спецсимволов по назначению

Далее представлен список кодов HTML разделённый на группы по назначению. (В скобках код UTF-8).

&#0 - &#31 (0000 – 001F) - Управляющие символы
&#32 - &#127 (0020 - 007F) - Основная латиница
&#128 - &#255 (0080 - 00FF) - Расширенная латиница-1
&#256 - &#383 (0100 - 017F) - Расширенная латиница-A
&#384 - &#591 (0180 - 024F) - Расширенная латиница-B
&#592 - &#687 (0250 - 02AF) - Международный фонетический алфавит
&#688 - &#767 (02B0 - 02FF) - Некомбинируемые протяжённые символы-модификаторы
&#768 - &#879 (0300 - 036F) - Комбинируемые диакритические знаки
&#880 - &#1023 (0370 - 03FF) - Греческий и коптский алфавиты
&#1024 - &#1279 (0400 - 04FF) - Кириллица
&#1280 - &#1322 (0500 - 052F) - Кириллица. Дополнительные символы
&#1328 - &#1423 (0530 - 058F) - Армянский алфавит
&#1424 - &#1535 (0590 - 05FF) - Иврит
&#1536 - &#1791 (0600 - 06FF) - Арабский
&#1792 - &#1871 (0700 - 074F) - Сирийский
&#1872 - &#1919 (0750 - 077F) - Дополнительные символы арабского письма
&#1920 - &#1983 (0780 - 07BF) - Тана
&#1984 - &#2047 (07C0 - 07FF) - Нко
&#2048 - &#2111 (0800 - 083F) - Самаритянское письмо
&#2112 - &#2143 (0840 - 085F) - Мандейский алфавит
&#2208 - &#2303 (08A0 - 08FF) - Расширенный набор символов арабского письма-A
&#2304 - &#2431 (0900 - 097F) - Деванагари
&#2432 - &#2559 (0980 - 09FF) - Бенгальский
&#2560 - &#2687 (0A00 - 0A7F) - Гурмухки
&#2688 - &#2815 (0A80 - 0AFF) - Гуджарати
&#2816 - &#2943 (0B00 - 0B7F) - Ория
&#2944 - &#3071 (0B80 - 0BFF) - Тамильская письменность
&#3072 - &#3199 (0C00 - 0C7F) - Телугу
&#3200 - &#3327 (0C80 - 0CFF) - Каннада
&#3328 - &#3455 (0D00 - 0D7F) - Малаялам
&#3456 - &#3583 (0D80 - 0DFF) - Сингальская письменность
&#3584 - &#3711 (0E00 - 0E7F) - Тайская письменность
&#3712 - &#3839 (0E80 - 0EFF) - Лаосская письменность
&#3840 - &#4095 (0F00 - 0FFF) - Тибетская письменность
&#4096 - &#4255 (1000 - 109F) - Бирманский
&#4256 - &#4351 (10A0 - 10FF) - Грузинский
&#4352 - &#4607 (1100 - 11FF) - Хангыль

Отдельно Хангыль собран на странице "Хангыль. Корея. Коды символов HTML"

&#4608 - &#4991 (1200 - 137F) - Эфиопская слоговая письменность
&#4992 - &#5023 (1380 - 139F) - Дополнительные символы эфиопской письменности
&#5024 - &#5119 (13A0 - 13FF) - Письменность чероки
&#5120 - &#5759 (1400 - 167F) - Канадское слоговое письмо
&#5760 - &#5791 (1680 - 169F) - Огамическое письмо
&#5792 - &#5887 (16A0 - 16FF) - Руническая письменность
&#5888 - &#5919 (1700 - 171F) - Тагальская письменность. Байбайин
&#5920 - &#5951 (1720 - 173F) - Хануноо
&#5952 - &#5983 (1740 - 175F) - Бухид
&#5984 - &#6015 (1760 - 177F) - Тагбанва
&#6016 - &#6143 (1780 - 17FF) - Кхмерская письменность
&#6144 - &#6319 (1800 - 18AF) - Старомонгольская письменность
&#6320 - &#6399 (18B0 - 18FF) - Расширенный набор символов канадского слогового письма
&#6400 - &#6479 (1900 - 194F) - Письменность лимбу
&#6480 - &#6527 (1950 - 197F) - Письменность тай лэ
&#6528 - &#6623 (1980 - 19DF) - Новый алфавит тай лы
&#6624 - &#6655 (19E0 - 19FF) - Кхмерские символы
&#6656 - &#6687 (1A00 - 1A1F) - Бугийская письменность. Лонтара
&#6688 - &#6831 (1A20 - 1AAF) - Старый алфавит тай лы. Тай Тхам
&#6912 - &#7047 (1B00 - 1B87) - Балийское письмо
&#7040 - &#7103 (1B80 - 1BBF) - Сунданское письмо
&#7104 - &#7167 (1BC0 - 1BFF) - Батакское письмо
&#7168 - &#7247 (1C00 - 1C4F) - Письмо лепча
&#7248 - &#7295 (1C50 - 1C7F) - Письменность Ол-чики
&#7360 - &#7375 (1CC0 - 1CCF) - Сунданское расширенное письмо
&#7376 - &#7423 (1CD0 - 1CFF) - Ведические символы
&#7424 - &#7551 (1D00 - 1D7F) - Фонетические расширения
&#7552 - &#7615 (1D80 - 1DBF) - Дополнительные фонетические расширения
&#7616 - &#7679 (1DC0 - 1DFF) - Дополнительные комбинируемые диакритические знаки
&#7680 - &#7935 (1E00 - 1EFF) - Дополнительная расширенная латиница
&#7936 - &#8191 (1F00 - 1FFF) - Расширенный набор символов греческого алфавита
&#8192 - &#8303 (2000 - 206F) - Знаки пунктуации
&#8304 - &#8351 (2070 - 209F) - Надстрочные и подстрочные знаки
&#8352 - &#8399 (20A0 - 20CF) - Символы валют
&#8400 - &#8447 (20D0 - 20FF) - Комбинируемые диакритические знаки для символов
&#8448 - &#8527 (2100 - 214F) - Буквоподобные символы
&#8528 - &#8591 (2150 - 218F) - Числовые формы
&#8592 - &#8703 (2190 - 21FF) - Стрелки
&#8704 - &#8959 (2200 - 22FF) - Математические операторы
&#8960 - &#9215 (2300 - 23FF) - Разнообразные технические символы
&#9216 - &#9279 (2400 - 243F) - Значки управляющих кодов
&#9280 - &#9311 (2440 - 245F) - Символы оптического распознавания
&#9312 - &#9471 (2460 - 24FF) - Вложенные буквы и цифры
&#9472 - &#9599 (2500 - 257F) - Символы для рисования рамок
&#9600 - &#9631 (2580 - 259F) - Символы заполнения
&#9632 - &#9727 (25A0 - 25FF) - Геометрические фигуры
&#9728 - &#9983 (2600 - 26FF) - Разнообразные символы
&#9984 - &#10175 (2700 - 27BF) - Дингбаты
&#10176 - &#10223 (27C0 - 27EF) - Разнообразные математические символы-A
&#10224 - &#10239 (27F0 - 27FF) - Дополнительные стрелки-A
&#10240 - &#10495 (2800 - 28FF) - Азбука Брайля
&#10496 - &#10623 (2900 - 297F) - Дополнительные стрелки-B
&#10624 - &#10751 (2980 - 29FF) - Разнообразные математические символы-B
&#10752 - &#11007 (2A00 - 2AFF) - Дополнительные математические операторы
&#11008 - &#11263 (2B00 - 2BFF) - Разнообразные символы и стрелки
&#11264 - &#11359 (2C00 - 2C5F) - Глаголица
&#11360 - &#11391 (2C60 - 2C7F) - Расширенная латиница C
&#11392 - &#11519 (2C80 - 2CFF) - Коптский алфавит
&#11520 - &#11567 (2D00 - 2D2F) - Дополнительные символы грузинского алфавита
&#11568 - &#11647 (2D30 - 2D7F) - Тифинаг (Древнеливийское письмо)
&#11648 - &#11743 (2D80 - 2DDF) - Расширенный набор символов эфиопского письма
&#11744 - &#11775 (2DE0 - 2DFF) - Расширенная кириллица A
&#11776 - &#11903 (2E00 - 2E7F) - Дополнительные знаки пунктуации

Теоретически все ↑ эти ↑ символы должны были отобразиться на странице Перебор кодов всех символов HTML с 1 по 10999, но увы реально прорисовывается гораздо меньше

&#11904 - &#12031 (2E80 - 2EFF) - Дополнительные иероглифические ключи ККЯ
&#12032 - &#12255 (2F00 - 2FDF) - Иероглифические ключи словаря Канси
&#12272 - &#12287 (2FF0 - 2FFF) - Символы описания иероглифов
&#12288 - &#12351 (3000 - 303F) - Символы и пунктуация ККЯ
&#12352 - &#12447 (3040 - 309F) - Хирагана
&#12448 - &#12543 (30A0 - 30FF) - Катакана
&#12544 - &#12591 (3100 - 312F) - Чжуинь. Бопомофо

↑ Эти ↑ три группы лучше смотреть на странице "Иероглифы региона Китай, Япония, Тайвань. Коды HTML

&#12592 - &#12687 (3130 - 318F) - Чамо, комбинируемое с хангылем

Отдельно Хангыль собран на странице "Хангыль. Корея. Коды символов HTML"


&#12688 - &#12703 (3190 - 319F) - Канбун(китайский)
&#12704 - &#12735 (31A0 - 31BF) - Расширенный набор символов бопомофо, чжуинь
&#12736 - &#12783 (31C0 - 31EF) - Черты ККЯ
&#12784 - &#12799 (31F0 - 31FF) - Фонетические расширения катаканы
&#12800 - &#13055 (3200 - 32FF) - Вложенные буквы и месяцы ККЯ
&#13056 - &#13311 (3300 - 33FF) - Знаки совместимости ККЯ
&#13312 - &#19903 (3400 - 4DBF) - Унифицированные иероглифы ККЯ
&#19904 - &#19967 (4DC0 - 4DFF) - Гексаграммы И-Цзин

↑ Эти ↑ символы должны были отобразиться на странице Символы с 12000 по 25999. Унифицированные иероглифы ККЯ (Китай, Корея, Япония), увы, довольно полно печатаются "Унифицированные иероглифы ККЯ", и так их очень много то им пришлось выделить ещё две страницы: Иероглифы ККЯ (Китай, Корея, Япония) с 26000 по 32999 и Иероглифы ККЯ (Китай, Корея, Япония) c 33000 по 40999


&#19968 - &#40959 (4E00 - 9FFF) - Унифицированные иероглифы ККЯ
&#40960 - &#42127 (A000 - A48F) - Слоги. Письмо И
&#42128 - &#42191 (A490 - A4CF) - Радикалы. Письмо И
&#42240 - &#42559 (A500 - A63F) - Слоговая письменность ваи
&#42560 - &#42655 (A640 - A69F) - Расширенная кириллица-B
&#42656 - &#42751 (A6A0 - A6FF) - Письмо бамум
&#42752 - &#42783 (A700 - A71F) - Символы изменения тона
&#42784 - &#43007 (A720 - A7FF) - Расширенная латиница-D
&#43008 - &#43055 (A800 - A82F) - Силоти нагри
&#43056 - &#43071 (A830 - A83F) - Индийские числовые символы
&#43072 - &#43135 (A840 - A87F) - Квадратное письмо Пагба-ламы
&#43136 - &#43231 (A880 - A8DF) - Саураштра
&#43232 - &#43263 (A8E0 - A8FF) - Расширенный набор символов деванагари
&#43264 - &#43311 (A900 - A92F) - Кайях Ли
&#43312 - &#43359 (A930 - A95F) - Реджанг
&#43360 - &#43391 (A960 - A97F) - Хангыль
&#43392 - &#43487 (A980 - A9DF) - Яванская письменность
&#43520 - &#43615 (AA00 - AA5F) - Тямское письмо
&#43616 - &#43647 (AA60 - AA7F) - Мьянманская письменность. Расширение A
&#43648 - &#43743 (AA80 - AADF) - Письменность Тай Вьет
&#43744 - &#43775 (AAE0 - AAFF) - Мейтей расширенная
&#43776 - &#43823 (AB00 - AB2F) - Набор расширенных символов эфиопского письма-А
&#43968 - &#44031 (ABC0 - ABFF) - Мейтей (Манипури)

Весь ↑ этот ↑ диапазон не отобразился не в одном из браузеров, зато следующие далее слоги Хангыля не уместились на одной странице "Иероглифы, слоги Хангыль. Корея с 44000 по 50999" и пришлось часть их перекинуть на последнюю страницу темы: "Остаток Хангыль. Совместимые ККЯ. Формы арабских 51000 - 65535"


&#44032 - &#55215 (AC00 - D7AF) - Слоги Хангыля
&#55296 - &#56191 (D800 - DB7F) - Верхняя часть суррогатных пар
&#56192 - &#56319 (DB80 - DBFF) - Верхняя часть суррогатных пар для частного использования
&#56320 - &#57343 (DC00 - DFFF) - Нижняя часть суррогатных пар
&#57344 - &#63743 (E000 - F8FF) - Область для частного использования
&#63744 - &#64255 (F900 - FAFF) - Совместимые иероглифы ККЯ
&#64256 - &#64335 (FB00 - FB4F) - Алфавитные формы представления
&#64336 - &#65023 (FB50 - FDFF) - Формы представления арабских букв-A
&#65024 - &#65039 (FE00 - FE0F) - Селекторы вариантов начертания
&#65040 - &#65055 (FE10 - FE1F) - Вертикальные формы
&#65056 - &#65071 (FE20 - FE2F) - Комбинируемые половинки символов
&#65072 - &#65103 (FE30 - FE4F) - Формы совместимости ККЯ
&#65104 - &#65135 (FE50 - FE6F) - Варианты малого размера
&#65136 - &#65279 (FE70 - FEFF) - Формы представления арабских букв-B
&#65280 - &#65519 (FF00 - FFEF) - Полуширинные и полноширинные формы
&#65520 - &#65535 (FFF0 - FFFF) - Специальные символы

Генератор символов HTML

По ссылке → Генератор символов HTML и UTF-8 есть страница с возможностью сгенерировать диапазон символов по одному номеру. Скрипт на ней отображает знаки с указанием шестнадцатеричного кода UTF-8