Перебор всех спецсимволов и их ввод
Как вводить спецсимволы (иероглифы, другие знаки) в код HTML
Код можно ввести десятичными цифрами и шестнадцатеричными, причём шестнадцатеричный код соответствует кодировке UTF-8. Собственно код десятичный численно равный шестнадцатеричному представлению это тот же UTF-8.
В десятичном исчислении код вводится, так же как и мнемоника, но после "&" добавляется "#", общий вид кода: "⭧"
В шестнадцатеричном представлении после «&#» добавляется «x», и общий вид становится "꾁"
↑ ↑ ↑ Со страницы "Мнемоники, спецсимволы и коды к ним в HTML"
Перебор всех символов HTML с сортировкой по назначению
Тема возникла из собственного эксперимента. Как-то вставляя в код страницы стрелочку "←", код ← задумался, а что ещё можно вставить в страницу без использования графики. Подбор цифр не давал полной картины, и пришлось автоматизировать процесс, использов возможности Exel (Позже появилась страница → Генератор символов HTML и UTF-8).
Сначала опробовал диапазон до 12000, даже показалось, что это все символы, но не тут-то было. Что бы перебрать всё получившееся, пришлось материал разложить на семь страниц и найти хоть какое-нибудь описание результата.
В итоге материал по простому перебору символов расположился страницах:
→ Перебор всех спецсимволов и их ввод
→ Перебор кодов всех символов HTML с 1 по 10999
→ Символы с 12000 по 25999. Унифицированные иероглифы ККЯ
→ Иероглифы ККЯ (Китай, Корея, Япония) с 26000 до 32999
→ Иероглифы ККЯ (Китай, Корея, Япония) c 33000-40999
→ Иероглифы, слоги Хангыль. Корея 44000 - 50999
→ Остаток Хангыль. Совместимые ККЯ. Формы арабских 51000 - 65535
Все страницы получились очень объёмными, поэтому, извините, грузятся долго и если хотите их увидеть, имейте терпение.
Большое количество символов не отображается ни одним из браузеров, но, тем не менее, в юникоде (UTF-8) их номера распределены по группам. Так как кодировка UTF-8 и коды символов связаны, то можно отсортировать их по назначению.
Сортировка спецсимволов по назначению
Далее представлен список кодов HTML разделённый на группы по назначению. (В скобках код UTF-8).
� -  (0000 – 001F) - Управляющие символы
  -  (0020 - 007F) - Основная латиница
€ - ÿ (0080 - 00FF) - Расширенная латиница-1
Ā - ſ (0100 - 017F) - Расширенная латиница-A
ƀ - ɏ (0180 - 024F) - Расширенная латиница-B
ɐ - ʯ (0250 - 02AF) - Международный фонетический алфавит
ʰ - ˿ (02B0 - 02FF) - Некомбинируемые протяжённые символы-модификаторы
̀ - ͯ (0300 - 036F) - Комбинируемые диакритические знаки
Ͱ - Ͽ (0370 - 03FF) - Греческий и коптский алфавиты
Ѐ - ӿ (0400 - 04FF) - Кириллица
Ԁ - Ԫ (0500 - 052F) - Кириллица. Дополнительные символы
԰ - ֏ (0530 - 058F) - Армянский алфавит
֐ - ׿ (0590 - 05FF) - Иврит
؀ - ۿ (0600 - 06FF) - Арабский
܀ - ݏ (0700 - 074F) - Сирийский
ݐ - ݿ (0750 - 077F) - Дополнительные символы арабского письма
ހ - ޿ (0780 - 07BF) - Тана
߀ - ߿ (07C0 - 07FF) - Нко
ࠀ - ࠿ (0800 - 083F) - Самаритянское письмо
ࡀ - ࡟ (0840 - 085F) - Мандейский алфавит
ࢠ - ࣿ (08A0 - 08FF) - Расширенный набор символов арабского письма-A
ऀ - ॿ (0900 - 097F) - Деванагари
ঀ - ৿ (0980 - 09FF) - Бенгальский
਀ - ੿ (0A00 - 0A7F) - Гурмухки
઀ - ૿ (0A80 - 0AFF) - Гуджарати
଀ - ୿ (0B00 - 0B7F) - Ория
஀ - ௿ (0B80 - 0BFF) - Тамильская письменность
ఀ - ౿ (0C00 - 0C7F) - Телугу
ಀ - ೿ (0C80 - 0CFF) - Каннада
ഀ - ൿ (0D00 - 0D7F) - Малаялам
඀ - ෿ (0D80 - 0DFF) - Сингальская письменность
฀ - ๿ (0E00 - 0E7F) - Тайская письменность
຀ - ໿ (0E80 - 0EFF) - Лаосская письменность
ༀ - ࿿ (0F00 - 0FFF) - Тибетская письменность
က - ႟ (1000 - 109F) - Бирманский
Ⴀ - ჿ (10A0 - 10FF) - Грузинский
ᄀ - ᇿ (1100 - 11FF) - Хангыль
Отдельно Хангыль собран на странице "Хангыль. Корея. Коды символов HTML"
ሀ - ፿ (1200 - 137F) - Эфиопская слоговая письменность
ᎀ - ᎟ (1380 - 139F) - Дополнительные символы эфиопской письменности
Ꭰ - ᏿ (13A0 - 13FF) - Письменность чероки
᐀ - ᙿ (1400 - 167F) - Канадское слоговое письмо
  - ᚟ (1680 - 169F) - Огамическое письмо
ᚠ - ᛿ (16A0 - 16FF) - Руническая письменность
ᜀ - ᜟ (1700 - 171F) - Тагальская письменность. Байбайин
ᜠ - ᜿ (1720 - 173F) - Хануноо
ᝀ - ᝟ (1740 - 175F) - Бухид
ᝠ - ᝿ (1760 - 177F) - Тагбанва
ក - ៿ (1780 - 17FF) - Кхмерская письменность
᠀ - ᢯ (1800 - 18AF) - Старомонгольская письменность
ᢰ - ᣿ (18B0 - 18FF) - Расширенный набор символов канадского слогового письма
ᤀ - ᥏ (1900 - 194F) - Письменность лимбу
ᥐ - ᥿ (1950 - 197F) - Письменность тай лэ
ᦀ - ᧟ (1980 - 19DF) - Новый алфавит тай лы
᧠ - ᧿ (19E0 - 19FF) - Кхмерские символы
ᨀ - ᨟ (1A00 - 1A1F) - Бугийская письменность. Лонтара
ᨠ - ᪯ (1A20 - 1AAF) - Старый алфавит тай лы. Тай Тхам
ᬀ - ᮇ (1B00 - 1B87) - Балийское письмо
ᮀ - ᮿ (1B80 - 1BBF) - Сунданское письмо
ᯀ - ᯿ (1BC0 - 1BFF) - Батакское письмо
ᰀ - ᱏ (1C00 - 1C4F) - Письмо лепча
᱐ - ᱿ (1C50 - 1C7F) - Письменность Ол-чики
᳀ - ᳏ (1CC0 - 1CCF) - Сунданское расширенное письмо
᳐ - ᳿ (1CD0 - 1CFF) - Ведические символы
ᴀ - ᵿ (1D00 - 1D7F) - Фонетические расширения
ᶀ - ᶿ (1D80 - 1DBF) - Дополнительные фонетические расширения
᷀ - ᷿ (1DC0 - 1DFF) - Дополнительные комбинируемые диакритические знаки
Ḁ - ỿ (1E00 - 1EFF) - Дополнительная расширенная латиница
ἀ - ῿ (1F00 - 1FFF) - Расширенный набор символов греческого алфавита
  -  (2000 - 206F) - Знаки пунктуации
⁰ - ₟ (2070 - 209F) - Надстрочные и подстрочные знаки
₠ - ⃏ (20A0 - 20CF) - Символы валют
⃐ - ⃿ (20D0 - 20FF) - Комбинируемые диакритические знаки для символов
℀ - ⅏ (2100 - 214F) - Буквоподобные символы
⅐ - ↏ (2150 - 218F) - Числовые формы
← - ⇿ (2190 - 21FF) - Стрелки
∀ - ⋿ (2200 - 22FF) - Математические операторы
⌀ - ⏿ (2300 - 23FF) - Разнообразные технические символы
␀ - ␿ (2400 - 243F) - Значки управляющих кодов
⑀ - ⑟ (2440 - 245F) - Символы оптического распознавания
① - ⓿ (2460 - 24FF) - Вложенные буквы и цифры
─ - ╿ (2500 - 257F) - Символы для рисования рамок
▀ - ▟ (2580 - 259F) - Символы заполнения
■ - ◿ (25A0 - 25FF) - Геометрические фигуры
☀ - ⛿ (2600 - 26FF) - Разнообразные символы
✀ - ➿ (2700 - 27BF) - Дингбаты
⟀ - ⟯ (27C0 - 27EF) - Разнообразные математические символы-A
⟰ - ⟿ (27F0 - 27FF) - Дополнительные стрелки-A
⠀ - ⣿ (2800 - 28FF) - Азбука Брайля
⤀ - ⥿ (2900 - 297F) - Дополнительные стрелки-B
⦀ - ⧿ (2980 - 29FF) - Разнообразные математические символы-B
⨀ - ⫿ (2A00 - 2AFF) - Дополнительные математические операторы
⬀ - ⯿ (2B00 - 2BFF) - Разнообразные символы и стрелки
Ⰰ - ⱟ (2C00 - 2C5F) - Глаголица
Ⱡ - Ɀ (2C60 - 2C7F) - Расширенная латиница C
Ⲁ - ⳿ (2C80 - 2CFF) - Коптский алфавит
ⴀ - ⴯ (2D00 - 2D2F) - Дополнительные символы грузинского алфавита
ⴰ - ⵿ (2D30 - 2D7F) - Тифинаг (Древнеливийское письмо)
ⶀ - ⷟ (2D80 - 2DDF) - Расширенный набор символов эфиопского письма
ⷠ - ⷿ (2DE0 - 2DFF) - Расширенная кириллица A
⸀ - ⹿ (2E00 - 2E7F) - Дополнительные знаки пунктуации
Теоретически все ↑ эти ↑ символы должны были отобразиться на странице Перебор кодов всех символов HTML с 1 по 10999, но увы реально прорисовывается гораздо меньше
⺀ - ⻿ (2E80 - 2EFF) - Дополнительные иероглифические ключи ККЯ
⼀ - ⿟ (2F00 - 2FDF) - Иероглифические ключи словаря Канси
⿰ - ⿿ (2FF0 - 2FFF) - Символы описания иероглифов
  - 〿 (3000 - 303F) - Символы и пунктуация ККЯ
぀ - ゟ (3040 - 309F) - Хирагана
゠ - ヿ (30A0 - 30FF) - Катакана
㄀ - ㄯ (3100 - 312F) - Чжуинь. Бопомофо
↑ Эти ↑ три группы лучше смотреть на странице "Иероглифы региона Китай, Япония, Тайвань. Коды HTML
㄰ - ㆏ (3130 - 318F) - Чамо, комбинируемое с хангылем
Отдельно Хангыль собран на странице "Хангыль. Корея. Коды символов HTML"
㆐ - ㆟ (3190 - 319F) - Канбун(китайский)
ㆠ - ㆿ (31A0 - 31BF) - Расширенный набор символов бопомофо, чжуинь
㇀ - ㇯ (31C0 - 31EF) - Черты ККЯ
ㇰ - ㇿ (31F0 - 31FF) - Фонетические расширения катаканы
㈀ - ㋿ (3200 - 32FF) - Вложенные буквы и месяцы ККЯ
㌀ - ㏿ (3300 - 33FF) - Знаки совместимости ККЯ
㐀 - 䶿 (3400 - 4DBF) - Унифицированные иероглифы ККЯ
䷀ - ䷿ (4DC0 - 4DFF) - Гексаграммы И-Цзин
↑ Эти ↑ символы должны были отобразиться на странице Символы с 12000 по 25999. Унифицированные иероглифы ККЯ (Китай, Корея, Япония), увы, довольно полно печатаются "Унифицированные иероглифы ККЯ", и так их очень много то им пришлось выделить ещё две страницы: Иероглифы ККЯ (Китай, Корея, Япония) с 26000 по 32999 и Иероглифы ККЯ (Китай, Корея, Япония) c 33000 по 40999
一 - 鿿 (4E00 - 9FFF) - Унифицированные иероглифы ККЯ
ꀀ - ꒏ (A000 - A48F) - Слоги. Письмо И
꒐ - ꓏ (A490 - A4CF) - Радикалы. Письмо И
ꔀ - ꘿ (A500 - A63F) - Слоговая письменность ваи
Ꙁ - ꚟ (A640 - A69F) - Расширенная кириллица-B
ꚠ - ꛿ (A6A0 - A6FF) - Письмо бамум
꜀ - ꜟ (A700 - A71F) - Символы изменения тона
꜠ - ꟿ (A720 - A7FF) - Расширенная латиница-D
ꠀ - ꠯ (A800 - A82F) - Силоти нагри
꠰ - ꠿ (A830 - A83F) - Индийские числовые символы
ꡀ - ꡿ (A840 - A87F) - Квадратное письмо Пагба-ламы
ꢀ - ꣟ (A880 - A8DF) - Саураштра
꣠ - ꣿ (A8E0 - A8FF) - Расширенный набор символов деванагари
꤀ - ꤯ (A900 - A92F) - Кайях Ли
ꤰ - ꥟ (A930 - A95F) - Реджанг
ꥠ - ꥿ (A960 - A97F) - Хангыль
ꦀ - ꧟ (A980 - A9DF) - Яванская письменность
ꨀ - ꩟ (AA00 - AA5F) - Тямское письмо
ꩠ - ꩿ (AA60 - AA7F) - Мьянманская письменность. Расширение A
ꪀ - ꫟ (AA80 - AADF) - Письменность Тай Вьет
ꫠ - ꫿ (AAE0 - AAFF) - Мейтей расширенная
꬀ - ꬯ (AB00 - AB2F) - Набор расширенных символов эфиопского письма-А
ꯀ - ꯿ (ABC0 - ABFF) - Мейтей (Манипури)
Весь ↑ этот ↑ диапазон не отобразился не в одном из браузеров, зато следующие далее слоги Хангыля не уместились на одной странице "Иероглифы, слоги Хангыль. Корея с 44000 по 50999" и пришлось часть их перекинуть на последнюю страницу темы: "Остаток Хангыль. Совместимые ККЯ. Формы арабских 51000 - 65535"
가 - 힯 (AC00 - D7AF) - Слоги Хангыля
� - � (D800 - DB7F) - Верхняя часть суррогатных пар
� - � (DB80 - DBFF) - Верхняя часть суррогатных пар для частного использования
� - � (DC00 - DFFF) - Нижняя часть суррогатных пар
 -  (E000 - F8FF) - Область для частного использования
豈 - 﫿 (F900 - FAFF) - Совместимые иероглифы ККЯ
ff - ﭏ (FB00 - FB4F) - Алфавитные формы представления
ﭐ - ﷿ (FB50 - FDFF) - Формы представления арабских букв-A
︀ - ️ (FE00 - FE0F) - Селекторы вариантов начертания
︐ - ︟ (FE10 - FE1F) - Вертикальные формы
︠ - ︯ (FE20 - FE2F) - Комбинируемые половинки символов
︰ - ﹏ (FE30 - FE4F) - Формы совместимости ККЯ
﹐ - ﹯ (FE50 - FE6F) - Варианты малого размера
ﹰ -  (FE70 - FEFF) - Формы представления арабских букв-B
＀ - ￯ (FF00 - FFEF) - Полуширинные и полноширинные формы
￰ -  (FFF0 - FFFF) - Специальные символы
По ссылке → Генератор символов HTML и UTF-8 есть страница с возможностью сгенерировать диапазон символов по одному номеру. Скрипт на ней отображает знаки с указанием шестнадцатеричного кода UTF-8