Алфавитный порядок - Alphabetical order

Алфавитный порядок это система, посредством которой строки символов размещаются в порядке, основанном на положении символов в обычном порядке алфавит. Это один из способов сопоставление. В математике лексикографический порядок является обобщением алфавитного порядка на другие типы данных, такие как последовательности цифр или чисел.

Применительно к струнам или последовательности что, помимо алфавитных символов, может содержать также цифры, числа или элементы более сложного типа, алфавитный порядок обычно называется лексикографический порядок.

Чтобы определить, какая из двух строк символов стоит первой при расположении в алфавитном порядке, их первые буквы сравниваются. Если они различаются, то строка, первая буква которой идет раньше в алфавите, идет раньше другой строки. Если первые буквы совпадают, то сравниваются вторые буквы и так далее. Если достигнута позиция, в которой у одной строки больше нет букв для сравнения, а у другой нет, то первая (более короткая) строка считается первой в алфавитном порядке.

Заглавные буквы (верхний регистр) обычно считаются идентичными соответствующим строчным буквам для целей алфавитного порядка, хотя могут быть приняты соглашения для обработки ситуаций, когда две строки отличаются Только в капитализации. Существуют также различные соглашения для обработки строк, содержащих пробелы, измененные буквы (например, с диакритические знаки ) и небуквенные символы, такие как знаки пунктуация.

В результате размещения набора слов или строк в алфавитном порядке все строки, начинающиеся с одной и той же буквы, группируются вместе; и внутри этой группы все слова, начинающиеся с одной и той же двухбуквенной последовательности, сгруппированы вместе; и так далее. Таким образом, система стремится максимизировать количество общих начальных букв между соседними словами.

История

Алфавитный порядок был впервые использован в 1-м тысячелетии. До н.э. северо-западными семитскими писцами, использующими Абджад система.[1] Однако ряд других методов классификации и упорядочивания материалов, включая географические, хронологический, иерархический и по категории, на протяжении веков предпочитались алфавиту.[2]

В Библия датируется VI – VII веками до нашей эры. в Книга Иеремии, пророк использует Атбаш подстановочный шифр, в алфавитном порядке. Точно так же библейские авторы использовали акростика на основании (заказанного) Еврейский алфавит.[3]

Впервые учёные эффективно использовали алфавитный порядок в качестве инструмента каталогизации, возможно, в древней Александрии,[4] в Великая Александрийская библиотека, который был основан около 300 г. до н. э. Поэт и ученый Каллимах, который там работал, считается, что создал первый в мире каталог библиотеки, известный как Pinakes, со свитками, расположенными на полках в алфавитном порядке по первым буквам имен авторов.[2]

В I веке до нашей эры римский писатель Варрон составлены алфавитные списки авторов и названий.[5] Во 2 веке нашей эры Секст Помпей Фест написал энциклопедический воплощение произведений Верриус Флаккус, De verborum Meaningatu, с записями в алфавитном порядке.[6] В 3 веке нашей эры Harpocration написал Гомерический лексика, отсортированная по всем буквам.[7] В X веке автор Суда используется алфавитный порядок с фонетическими вариациями.

Алфавитный порядок как помощь в консультации начал входить в мейнстрим Западноевропейский интеллектуальная жизнь во второй половине 12 века, когда были разработаны алфавитные инструменты, помогающие проповедники анализировать библейский словарный запас. Это привело к составлению алфавитных согласования Библии Доминиканские монахи в Париж в 13 веке под Хью Сен-Шер. Старые справочные работы, такие как Святой Иероним с Толкование еврейских имен были упорядочены в алфавитном порядке для облегчения консультации. Ученые сначала сопротивлялись использованию алфавитного порядка, ожидая, что их ученики овладеют своей областью обучения в соответствии с его собственными рациональными структурами; его успех был обусловлен такими инструментами, как Роберт Килвардби индекс к произведениям Святой Августин, что помогло читателям получить доступ к полному оригинальному тексту вместо того, чтобы зависеть от компиляций выдержки которые стали известными в 12 веке схоластика. Принятие алфавитного порядка было частью перехода от первенства объем памяти к письменным работам.[8] Идея упорядочить информацию по алфавиту также встретила сопротивление составителей энциклопедий в XII и XIII веках, которые все были набожными церковниками. Они предпочли организовать свой материал теологически - в порядке творения Бога, начиная с Деус (имеется в виду Бог).[2]

В 1604 г. Роберт Каудри пришлось объяснять в Таблица по алфавиту, первый одноязычный английский толковый словарь, «Теперь, если слово, которое ты хочешь найти, начинается с (а), тогда смотри в начало этой Таблицы, а если с (v) смотри в конец».[9] Хотя еще в 1803 г. Сэмюэл Тейлор Кольридж осужденные энциклопедии с «расположением, определенным случайностью начальных букв»,[10] многие списки сегодня основаны на этом принципе.

Упорядочение в алфавитном порядке можно рассматривать как фактор демократизации доступа к информации, так как не требуется обширных предварительных знаний, чтобы найти то, что было необходимо.[2]

Заказ латиницей

Основной порядок и пример

Стандартный порядок современного Базовый латинский алфавит ISO является:

АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЫЭЮЯ

Ниже приводится пример простого алфавитного упорядочивания:

  • В качестве; Астра; Астролябия; Астрономия; Астрофизика; В; Атаман; Атака; Баа

Другой пример:

  • Ракушка; Быть; Был; Выгода; Согнутый

Вышеупомянутые слова расположены в алфавитном порядке. В качестве приходит раньше Астра потому что они начинаются с тех же двух букв и В качестве после этого больше нет букв, тогда как Астра делает. Следующие три слова идут после Астра потому что их четвертая буква (первая, которая отличается) - р, который следует после е (четвертая буква Астра) в алфавите. Сами слова расположены в порядке их шестой буквы (л, п и п соответственно). Затем идет В, который отличается от предыдущих слов второй буквой (т идет после s). Атаман идет после В по той же причине, что Астра пришел после В качестве. Атака следует Атаман на основе сравнения их третьих букв, и Баа идет после всех остальных, потому что у него другая первая буква.

Обработка многословных строк

Когда некоторые из заказываемых строк состоят из более чем одного слова, т. Е. Содержат пробелы или другие разделители, такие как дефисы, то можно использовать два основных подхода. В первом подходе все строки сначала упорядочиваются в соответствии с их первым словом, как в последовательности:

  • Дуб; Дубовый холм; Oak Ridge; Окли Парк; Oakley River
    где все строки начинаются с отдельного слова дуб предшествовать всем этим началу Окли, потому что дуб предшествует Окли в алфавитном порядке.

Во втором подходе строки располагаются в алфавитном порядке, как если бы в них не было пробелов, что дает последовательность:

  • Дуб; Дубовый холм; Окли Парк; Река Окли; Oak Ridge
    куда Oak Ridge теперь идет после Окли струны, как если бы было написано «Окридж».

Второй подход обычно используется в словарях.[нужна цитата ], поэтому его часто называют порядок словаря к издатели. Первый подход часто использовался в указатели книг, хотя каждый издатель традиционно устанавливает свои стандарты, какой подход использовать в нем; не было стандарта ISO для книжных указателей (ISO 999 ) до 1975 года.

Особые случаи

Измененные буквы

Во французском языке измененные буквы (например, с диакритические знаки ) обрабатываются так же, как базовая буква для целей алфавитного порядка. Например, роль находится между камень и Роза, как если бы это было написано роль. Однако языки, в которых такие буквы используются систематически, обычно имеют свои собственные правила упорядочивания. Видеть Конкретные языковые соглашения ниже.

Заказ по фамилии

В большинстве культур, где фамилии написаны после второе имя, по-прежнему желательно сортировать списки имен (как в телефонных справочниках) сначала по фамилии. В этом случае необходимо изменить порядок имен для правильной сортировки. Например, Хуана Эрнандеса и Брайана О'Лири следует отсортировать как «Эрнандес, Хуан» и «О'Лири, Брайан», даже если они написаны иначе. Уловить это правило в компьютерном алгоритме сопоставления сложно, и простые попытки обязательно потерпят неудачу. Например, если алгоритм не имеет в своем распоряжении обширного списка фамилий, невозможно определить, является ли «Джиллиан Люсиль ван дер Ваал» «Ван дер Ваал, Джиллиан Люсиль», «Ваал, Джиллиан Люсиль ван дер», или даже «Люсиль ван дер Ваал, Джиллиан».

Упорядочивание по фамилии часто встречается в академическом контексте. В рамках одной статьи с несколькими авторами упорядочивание авторов в алфавитном порядке по фамилии, а не с помощью других методов, таких как обратный стаж или субъективная степень вклада в статью, рассматривается как способ «признательности за аналогичный вклад» или «избежать [ing] дисгармония в сотрудничающих группах ».[11] Практика в определенных областях заказа цитаты в библиографиях по фамилиям их авторов было обнаружено, что это создает предвзятость в пользу авторов с фамилиями, которые появляются раньше в алфавите, тогда как этот эффект не проявляется в полях, в которых библиографии упорядочены в хронологическом порядке.[12]

В и другие общие слова

Если фраза начинается с очень распространенного слова (например, «the», «a» или «an», которое в грамматике называется артиклем), это слово иногда игнорируется или перемещается в конец фразы, но это не всегда дело. Например, книга "Сияние "может трактоваться как" Сияющий "или" Сияющий, "и, следовательно, перед названием книги"Лето Сэма ", хотя его также можно трактовать как просто" Сияние "и после" Лето Сэма ". Точно так же"Морщинка во времени "может трактоваться как" Морщинка во времени "," Морщинка во времени, A "или" Морщинка во времени ". Все три метода алфавитизации довольно легко создать с помощью алгоритма, но многие программы вместо этого полагаются на простые лексикографический порядок. Статьи обычно игнорируются при расположении по алфавиту.

Mac префиксы

Приставки M ' и Mc в ирландских и шотландских фамилиях - аббревиатуры для Mac, и иногда располагаются в алфавитном порядке, как если бы написание Mac в полном объеме. Таким образом Маккинли может быть указан перед Макинтош (как было бы, если бы это было написано как «Мак-Кинли»). С появлением компьютерно-сортированных списков этот тип алфавита встречается реже, хотя он все еще используется в британских телефонных справочниках.

Лигатуры

Лигатуры (две или более букв, объединенные в один символ), которые не считаются отдельными буквами, например Æ и Œ в английском языке они обычно сопоставляются так, как если бы буквы были отдельными - «эфир» и «эфир» были бы упорядочены одинаково по отношению ко всем другим словам. Это верно даже тогда, когда лигатура не является чисто стилистической, как в заимствования и торговые марки.

Для сортировки строк могут потребоваться специальные правила, которые различаются только в зависимости от того, соединены ли две буквы лигатурой.

Обработка цифр

Когда некоторые строки содержат цифры (или другие небуквенные символы) возможны различные подходы. Иногда такие символы обрабатываются так, как если бы они стояли до или после всех букв алфавита. Другой метод - сортировка чисел в алфавитном порядке, как они пишутся: например 1776 будет отсортировано так, как если бы было написано «семнадцать семьдесят шесть», и 24 часа дю Мана как бы пишется «vingt-quatre ...» (по-французски «двадцать четыре»). Когда цифры или другие символы используются в качестве специальных графических форм букв, например 1337 за позвольте или фильм Семь (стилизованный под Se7en), их можно отсортировать, как если бы они были этими буквами. Естественный порядок сортировки упорядочивает строки в алфавитном порядке, за исключением того, что многозначные числа обрабатываются как один символ и упорядочиваются по значению числа, закодированного цифрами.

Конкретные языковые соглашения

Языки, использующие расширенный латинский алфавит как правило, существуют свои правила обращения с лишними буквами. Также на некоторых языках определенные диграфы рассматриваются как отдельные буквы для целей сортировки. Например, 29-буквенный алфавит испанский лечит ñ как основное письмо после п, и раньше рассматривали диграфы ch и ll как основные буквы, следующие за c и л, соответственно. Ch и ll все еще считаются буквами, но теперь они расположены по алфавиту как двухбуквенные комбинации. (Новое правило алфавитизации было издано Королевская испанская академия в 1994 г.) С другой стороны, орграф rr следует rqu как и ожидалось, и сделал это даже до правила алфавитности 1994 года.

В некоторых случаях, например, Kiowa, алфавит полностью переупорядочен.

Правила алфавита, применяемые к различным языкам, перечислены ниже.

  • В Азербайджанский, есть восемь дополнительных букв к стандартному латинскому алфавиту. Пять из них - гласные: i, ı, ö, ü, ə и три согласных: ç, ş, ğ. Алфавит такой же, как и Турецкий алфавит, с теми же звуками, написанными теми же буквами, за исключением трех дополнительных букв: q, x и ə для звуков, которых нет в турецком языке. Хотя все «турецкие буквы» расположены в их «нормальном» алфавитном порядке, как и в турецком, три дополнительных буквы сопоставляются произвольно после букв, звуки которых близки к их. Итак, q сопоставляется сразу после k, x (произносится как немецкое ch) сортируется сразу после h и ə (произносится примерно как английское сокращение а) сортируется сразу после e.
  • В Бретонский, нет «c», «q», «x», но есть орграфы «ch» и «c'h», которые сопоставляются между «b» и «d». Например: «buzhugenn, chug, c'hoar, daeraouenn» (дождевой червь, сок, сестра, слеза).
  • В Боснийский, хорватский и сербский и других родственных южнославянских языках, пять акцентированных символов и три соединенных символа сортируются после оригиналов: ..., C, Č, Ć, D, DŽ, Đ, E, ..., L, LJ, M, N , NJ, O, ..., S, Š, T, ..., Z, Ž.
  • В Чешский и словацкий гласные с ударением имеют второстепенный вес при сопоставлении - по сравнению с другими буквами, они рассматриваются как их формы без ударения (A-Á, E-É-Ě, I-Í, O-Ó-Ô, U-Ú-Ů, Y- ), но затем они сортируются после букв без ударения (например, правильный лексикографический порядок: baa, baá, báa, bab, báb, bac, bác, bač, báč). Согласные с ударением (с Caron ) имеют первичный вес сортировки и размещаются сразу после своих копий без ударения, за исключением Ď, Ň и Ť, которые снова имеют вторичный вес. CH считается отдельной буквой и находится между ЧАС и я. На словацком, DZ и также считаются отдельными буквами и располагаются между Ď и E (A-Á-Ä-B-C-Č-D-Ď-DZ-DŽ-E-É ...).
  • в Датский и норвежский алфавиты, присутствуют те же дополнительные гласные, что и в шведском (см. ниже), но в другом порядке и с другим глифы (..., X, Y, Z, Æ, Ø, Å ). Кроме того, «Aa» сравнивается как эквивалент «Å». В датском алфавите "W" традиционно рассматривается как вариант "V", но сегодня "W" считается отдельной буквой.
  • В нидерландский язык комбинация IJ (представляющая IJ ) ранее должен был быть сопоставлен как Y (или иногда как отдельная буква Y Эймёйден, река Эйссел и страна IJsland (Исландия ).
  • В эсперанто, согласные с циркумфлекс акценты (ĉ, грамм, час, ĵ, ŝ), а также ŭ (ты с бреве ), считаются отдельными буквами и сопоставляются отдельно (c, ĉ, d, e, f, g, ĝ, h, ĥ, i, j, ĵ ... s, ŝ, t, u, ŭ, v, z ).
  • В эстонский х, ä, ö и ü считаются отдельными буквами и сопоставляются после ш. Буквы š, z и ž появляются только в заимствованных словах и иностранных именах собственных и следуют за буквой s в Эстонский алфавит, который в остальном не отличается от основного латинского алфавита.
  • В Фарерский алфавит также есть некоторые дополнительные буквы датского, норвежского и шведского языков, а именно Æ и Ø. Кроме того, Фарерский алфавит использует исландский eth, который следует D. Пять из шести гласных А, я, О, U и Y могут иметь акценты и после этого считаются отдельными буквами. Согласные C, Q, Икс, W и Z не найдены. Следовательно, первые пять букв А, Á, B, D и Ð, а последние пять V, Y, Ý, Æ, Ø
  • В Филиппинский (тагальский) и других филиппинских языках буква Ng рассматривается как отдельная буква. Произносится как пение, пинг-понг и т. Д. Само собой произносится нан, а вообще Филиппинская орфография, оно пишется как две отдельные буквы (n и g). Кроме того, производные от букв (например, Ñ ) сразу после базовой буквы. Филиппинский также пишется с диакритическими знаками, но их использование очень редко (кроме тильда ). (Филиппинская орфография также включает орфографию.)
  • В Финский алфавит и правила сопоставления такие же, как и в шведском.
  • За Французский, то последний ударение в данном слове определяет порядок.[13] Например, во французском языке следующие четыре слова будут отсортированы таким образом: cote
  • В Немецкий буквы с умлаутом (Ä, Ö, Ü ) обрабатываются, как правило, так же, как и их версии без umlauted; SS всегда сортируется как ss. Это составляет алфавитный порядок Ärgerlich, Arg, Arm, Assistant, Aßlar, Assoziation. Для телефонных справочников и аналогичных списков имен умлауты должны быть сопоставлены как буквенные комбинации «ae», «oe», «ue», потому что ряд немецких фамилий появляется как с умлаутом, так и в неавторизованной форме с «e». "(Мюллер / Мюллер). Это составляет алфавитный порядок Udet, Übelacker, Uell, Ülle, Ueve, Üxküll, Uffenbach.
  • В Венгерский гласные имеют ударение, умляуты и двойные ударения, а согласные пишутся одинарными, двойными (орграфы) или тройными (триграфы) символами. При сопоставлении гласные с акцентом эквивалентны своим аналогам без ударения, а двойные и тройные символы следуют за их одиночными оригиналами. Венгерский алфавитный порядок: A = Á, ДО Н.Э, CS, D, Dz, Dzs, E = É, F, G, Гр, H, I = Í, J, K, L, Ly, M, N, Нью-Йорк, O = Ó, Ö = Ő, P, Q, R, S, Sz, Т, Ty, U = Ú, Ü = Ű, V, W, X, Y, Z, Zs. (До 1984 г. дз и dzs считались не отдельными буквами для сопоставления, а двумя буквами каждая, d + z и d + zs.) Это означает, например, что Nádcukor должен предшествовать nádcsomó (хотя s обычно предшествует ты), поскольку c предшествует cs в сопоставлении. Различие в длине гласных следует принимать во внимание только в том случае, если два слова в остальном идентичны (например, egér, éger). Пробелы и дефисы внутри фраз при сопоставлении игнорируются. Ch также встречается как орграф в определенных словах, но не рассматривается как графема сама по себе с точки зрения сопоставления.
    Особенностью венгерского сопоставления является то, что сжатые формы двойных ди- и триграфов (например, ggy из gy + gy или же ddzs из dzs + dzs) должны быть сопоставлены, как если бы они были написаны полностью (независимо от факта сокращения и элементов ди- или триграфов). Например, Kaszinó должен предшествовать касса (хотя 4-й символ z обычно приходит после s в алфавите), потому что четвертый «символ» (графема ) слова касса считается вторым sz (разложение ссз в sz + sz), что следует яKaszinó).
  • В исландский, Þ добавляется, а за D следует Ð. За каждой гласной (A, E, I, O, U, Y) следует соответствующий ей острый: Á, É, Í, Ó, Ú, Ý. Z нет, поэтому алфавит заканчивается: ... X, Y, Ý, Þ, Æ, Ö.
    • Обе буквы также использовались Англосаксонский писцы, которые также использовали руническую букву Винн представлять / w /.
    • Þ (называемый шипом; строчная) также является рунической буквой.
    • Ð (называется eth; нижний регистр ð) - это буква D с добавленным штрихом.
  • Kiowa упорядочен по фонетическим принципам, как и Брахмические сценарии, а не в историческом латинском порядке. Сначала идут гласные, затем прекращаются согласные, расположенные от передней части к задней части рта и от отрицательной к положительной. время начала голоса, затем аффрикаты, фрикативы, жидкости и назальные средства:
A, AU, E, I, O, U, B, F, P, V, D, J, T, TH, G, C, K, Q, CH, X, S, Z, L, Y, W, H, M, N
  • В Литовский, конкретно литовские буквы идут после своих латинских оригиналов. Другое изменение в том, что Y приходит прямо перед J: ... G, H, I, Į, Y, J, K ...
  • В Польский, в частности, польские буквы, полученные из латинского алфавита, сортируются после их оригиналов: A, Ą, B, C, Ć, D, E, Ę, ..., L, Ł, M, N, Ń, O, Ó, P , ..., S, Ś, T, ..., Z, Ź, Ż. Орграфы для целей сопоставления обрабатываются так, как если бы они были двумя отдельными буквами.
  • В португальский, порядок сортировки такой же, как в английском: A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z. Орграфы и буквы с диакритическими знаками в алфавит не входят.
  • В румынский, специальные символы, полученные из латинского алфавита, сортируются по оригиналам: A, Ă, Â, ..., I, Î, ..., S, Ș, T, Ț, ..., Z.
  • испанский обрабатывались (до 1994 г.) "CH" и "LL" как отдельные буквы, что давало порядок синко, кредо, Chispa и ломо, луз, лама. Это уже не так, поскольку в 1994 г. RAE принял более традиционное использование, и теперь LL сопоставляется между LK и LM, а CH - между CG и CI. Шесть символов с диакритическими знаками Á, É, Í, Ó, Ú, Ü рассматриваются как исходные буквы A, E, I, O, U, например: радио, рафага, рана, рапидо, растрилло. Единственный вопрос сопоставления, относящийся к испанскому языку: Ñ (eñe ) как другая буква, сопоставленная после N.
  • в Шведский алфавит, есть три дополнительных гласные помещенный в его конец (..., X, Y, Z, Å, Ä, Ö ), похожий на датский и норвежский алфавит, но с разными глифами и другим порядком сортировки. Буква «W» рассматривалась как вариант «V», но в 13-м издании Svenska Akademiens ordlista (2006) «W» считалось отдельной буквой.
  • в Турецкий алфавит есть 6 дополнительных букв: ç, ğ, ı, ö, ş и ü (но без q, w и x). Они сопоставляются с ç после c, ğ после g, ı перед i, ö после o, ş после s и ü после u. Первоначально, когда в 1928 году был введен алфавит, ı был сопоставлен после i, но порядок был изменен позже, так что буквы, имеющие форму, содержащую точки, седили или другие украшающие знаки, всегда следовали за буквами с соответствующими голыми формами. Обратите внимание, что в турецкой орфографии буква I - это большая буква без точки ı, тогда как İ - это большая точка с точкой i.
  • Во многих Тюркские языки (Такие как Азербайджанский или Jaꞑalif орфография для Татарский ), раньше была буква Га (Ƣƣ), который находится между грамм и ЧАС. Сейчас он не используется.
  • В вьетнамский, есть 7 дополнительных букв: ă, â, đ, ê, ô, ơ, ư пока ж, j, ш, z отсутствуют, хотя они все еще используются (например, адрес в Интернете, иностранный заимствованный язык). «f» заменяется комбинацией «ph». То же, что и для «w», это «qu».
  • В Волапюк ä, ö и ü считаются отдельными буквами и сопоставляются отдельно (a, ä, b ... o, ö, p ... u, ü, v), а q и ш отсутствуют.[14]
  • В валлийский орграфы CH, DD, FF, NG, LL, PH, RH и TH рассматриваются как отдельные буквы, и каждый из них перечисляется после первого символа пары (за исключением NG, который указан после G), производя порядок A , B, C, CH, D, DD, E, F, FF, G, NG, H и так далее. Однако иногда может случиться, что сложение слов приводит к сопоставлению двух букв, которые нет образуют орграф. Примером может служить слово LLONGYFARCH (составленное из LLON + GYFARCH). Это приводит к такому упорядочению, как, например, LAWR, LWCUS, LLONG, LLOM, LLONGYFARCH (NG - это орграф в LLONG, но не в LLONGYFARCH). Комбинация букв R + H (в отличие от орграфа RH) может аналогичным образом возникать при сопоставлении в составных словах, хотя это, как правило, не приводит к появлению пар, в которых неправильная идентификация может повлиять на упорядочение. Для других потенциально сбивающих с толку сочетаний букв, которые могут возникнуть, а именно D + D и L + L, в написании используется дефис (например, AD-DAL, CHWIL-LYS).

Автоматизация

Алгоритмы сопоставления (в комбинации с алгоритмы сортировки ) используются в компьютерном программировании для размещения строк в алфавитном порядке. Стандартный пример - Алгоритм сортировки Unicode, который можно использовать для размещения строк, содержащих любые Unicode символы в алфавитном порядке (расширение).[13] Его можно сделать так, чтобы он соответствовал большинству языковых соглашений, описанных выше, путем настройки его таблицы сопоставления по умолчанию. Несколько таких пошивов собраны в Общий репозиторий данных локали.

Подобные заказы

Принцип алфавитного порядка по-прежнему может применяться к языкам, которые, строго говоря, не используют алфавит - например, они могут быть написаны с использованием слоговое письмо или же Abugida - при условии, что используемые символы имеют установленный порядок.

За логографический системы письма, такие как китайский Ханзи или японский кандзи, метод радикально-штриховая сортировка часто используется как способ определения порядка символов. В японском языке иногда используется порядок произношения, чаще всего с Годзюон порядок, но иногда со старшими Ироха заказ.

В математике лексикографический порядок это средство упорядочивания последовательностей аналогично тому, как используется для создания алфавитного порядка.[15]

Некоторые компьютерные приложения используют вариант алфавитного порядка, который может быть достигнут с помощью очень простого алгоритм, основываясь исключительно на ASCII или же Unicode коды для символов. Это может иметь нестандартные эффекты, такие как размещение всех заглавных букв перед строчными. Видеть ASCIIбетальный порядок.

А словарь рифм основан на сортировке слов в алфавитном порядке от последней до первой буквы слова.

Смотрите также

Рекомендации

  1. ^ Рейнхард Г. Леманн: «27-30-22-26. Сколько букв требует алфавита? Пример семитского языка», в: Идея письма: Письмо через границы, под редакцией Алекса де Вугта и Иоахима Фридриха Кряка, Лейден: Brill 2012, стр. 11–52.
  2. ^ а б c d Стрит, Джули (10 июня 2020 г.). «От А до Я - удивительная история алфавитного порядка» (текст и аудио). ABC News (ABC Radio National). Австралийская радиовещательная корпорация. Получено 6 июля 2020.
  3. ^ например Псалмы 25, 34, 37, 111, 112, 119 и 145 еврейской Библии
  4. ^ Дейли, Ллойд. Вклад в историю алфавита в древности и средневековье. Брюссель, 1967. стр. 25.
  5. ^ О'Хара, Джеймс (1989). "Мессап, Цикн и Алфавитный порядок Каталог итальянских героев Вергилия". 43: 35–38. JSTOR  1088539. Цитировать журнал требует | журнал = (помощь)
  6. ^ LIVRE XI - texte latin - перевод + комментарии.
  7. ^ Гибсон, Крейг (2002). Интерпретация классики: Демосфен и его древние комментаторы.
  8. ^ Роуз, Мэри А .; Роуз, Ричард М. (1991) "Statim Invenire: Школы, проповедники и новое отношение к странице », Подлинные свидетели: подходы к средневековым текстам и рукописям, University of Notre Dame Press, стр. 201–219, ISBN  0-268-00622-9
  9. ^ Cawdrey, Роберт (1604). Таблица по алфавиту. Лондон. п. [A4] v.
  10. ^ Письма Кольриджа, No 507.
  11. ^ Чарнтке, Тейя; Хохберг, Майкл Э; Рэнд, Татьяна А; Реш, Винсент Х; Краусс, Йохен (январь 2007 г.). «Последовательность авторов и кредит за вклады в публикации с несколькими авторами». PLoS Biol. 5 (1). Дои:10.1371 / journal.pbio.0050018. ЧВК  1769438. PMID  17227141.
  12. ^ Стивенс, Джеффри Р .; Дуке, Хуан Ф. (2018). «Порядок имеет значение: упорядочение цитирования в алфавитном порядке приводит к искажению показателей цитирования» (PDF). Психономический бюллетень и обзор. Дои:10.3758 / s13423-018-1532-8. Сложить резюмеВнутри Высшего Эд (22 октября 2018 г.).
  13. ^ а б «Технический стандарт Unicode № 10: алгоритм сортировки Unicode». Unicode, Inc. (unicode.org). 20 марта 2008 г.. Получено 27 августа 2008.
  14. ^ Мидгли, Ральф. "Волапюк к английскому словарю" (PDF). Архивировано из оригинал (PDF) 1 сентября 2012 г.. Получено 24 сентября 2019.
  15. ^ Франц Баадер; Тобиас Нипков (1999). Перезапись терминов и все такое. Издательство Кембриджского университета. С. 18–19. ISBN  978-0-521-77920-3.

дальнейшее чтение

  • Шовен, Ивонн. Pratique du classement alphabétique. 4e éd. Париж: Борда, 1977. ISBN  2-04-010155-1

внешняя ссылка