Add new Unicode 16 Scripts

Azoy · Azoy · commit eda2ffa87483 · 2025-02-12T09:54:20.000-08:00
diff --git a/Sources/_RegexParser/Regex/Parse/CharacterPropertyClassification.swift b/Sources/_RegexParser/Regex/Parse/CharacterPropertyClassification.swift
@@ -237,6 +237,7 @@ extension Parser {
       case "elba", "elbasan":               return .elbasan
       case "elym", "elymaic":               return .elymaic
       case "ethi", "ethiopic":              return .ethiopic
+      case "gara", "garay":                 return .garay
       case "geor", "georgian":              return .georgian
       case "glag", "glagolitic":            return .glagolitic
       case "gong", "gunjalagondi":          return .gunjalaGondi
@@ -245,6 +246,7 @@ extension Parser {
       case "gran", "grantha":               return .grantha
       case "grek", "greek":                 return .greek
       case "gujr", "gujarati":              return .gujarati
+      case "gukh", "gurungkhema":           return .gurungKhema
       case "guru", "gurmukhi":              return .gurmukhi
       case "hang", "hangul":                return .hangul
       case "hani", "han":                   return .han
@@ -261,11 +263,13 @@ extension Parser {
       case "java", "javanese":              return .javanese
       case "kali", "kayahli":               return .kayahLi
       case "kana", "katakana":              return .katakana
+      case "kawi":                          return .kawi
       case "khar", "kharoshthi":            return .kharoshthi
       case "khmr", "khmer":                 return .khmer
       case "khoj", "khojki":                return .khojki
       case "kits", "khitansmallscript":     return .khitanSmallScript
       case "knda", "kannada":               return .kannada
+      case "krai", "kiratrai":              return .kiratRai
       case "kthi", "kaithi":                return .kaithi
       case "lana", "taitham":               return .taiTham
       case "laoo", "lao":                   return .lao
@@ -293,6 +297,7 @@ extension Parser {
       case "mtei", "meeteimayek":           return .meeteiMayek
       case "mult", "multani":               return .multani
       case "mymr", "myanmar":               return .myanmar
+      case "nagm", "nagmundari":            return .nagMundari
       case "nand", "nandinagari":           return .nandinagari
       case "narb", "oldnortharabian":       return .oldNorthArabian
       case "nbat", "nabataean":             return .nabataean
@@ -301,6 +306,7 @@ extension Parser {
       case "nshu", "nushu":                 return .nushu
       case "ogam", "ogham":                 return .ogham
       case "olck", "olchiki":               return .olChiki
+      case "onao", "olonal":                return .olOnal
       case "orkh", "oldturkic":             return .oldTurkic
       case "orya", "oriya":                 return .oriya
       case "osge", "osage":                 return .osage
@@ -332,6 +338,7 @@ extension Parser {
       case "sora", "sorasompeng":           return .soraSompeng
       case "soyo", "soyombo":               return .soyombo
       case "sund", "sundanese":             return .sundanese
+      case "sunu", "sunuwar":               return .sunuwar
       case "sylo", "sylotinagri":           return .sylotiNagri
       case "syrc", "syriac":                return .syriac
       case "tagb", "tagbanwa":              return .tagbanwa
@@ -349,7 +356,9 @@ extension Parser {
       case "tibt", "tibetan":               return .tibetan
       case "tirh", "tirhuta":               return .tirhuta
       case "tnsa", "tangsa":                return .tangsa
+      case "todr", "todhri":                return .todhri
       case "toto":                          return .toto
+      case "tutg", "tulutigalari":          return .tuluTigalari
       case "ugar", "ugaritic":              return .ugaritic
       case "vaii", "vai":                   return .vai
       case "vith", "vithkuqi":              return .vithkuqi
diff --git a/Sources/_RegexParser/Utility/MissingUnicode.swift b/Sources/_RegexParser/Utility/MissingUnicode.swift
@@ -12,13 +12,13 @@
 // MARK: - Missing stdlib API
 
 extension Unicode {
-  // Note: The `Script` enum includes the "meta" script type "Katakana_Or_Hiragana", which
-  // isn't defined by https://www.unicode.org/Public/UCD/latest/ucd/Scripts.txt,
-  // but is defined by https://www.unicode.org/Public/UCD/latest/ucd/PropertyValueAliases.txt.
-  // We may want to split it out, as it's the only case that is a union of
-  // other script types.
-
   /// Character script types.
+  ///
+  /// Note this includes the "meta" script type "Katakana_Or_Hiragana", which
+  /// isn't defined by https://www.unicode.org/Public/UCD/latest/ucd/Scripts.txt,
+  /// but is defined by https://www.unicode.org/Public/UCD/latest/ucd/PropertyValueAliases.txt.
+  /// We may want to split it out, as it's the only case that is a union of
+  /// other script types.
   public enum Script: String, Hashable, CaseIterable {
     case adlam = "Adlam"
     case ahom = "Ahom"
@@ -59,6 +59,7 @@ extension Unicode {
     case elbasan = "Elbasan"
     case elymaic = "Elymaic"
     case ethiopic = "Ethiopic"
+    case garay = "Garay"
     case georgian = "Georgian"
     case glagolitic = "Glagolitic"
     case gothic = "Gothic"
@@ -67,6 +68,7 @@ extension Unicode {
     case gujarati = "Gujarati"
     case gunjalaGondi = "Gunjala_Gondi"
     case gurmukhi = "Gurmukhi"
+    case gurungKhema = "Gurung_Khema"
     case han = "Han"
     case hangul = "Hangul"
     case hanifiRohingya = "Hanifi_Rohingya"
@@ -83,6 +85,7 @@ extension Unicode {
     case kannada = "Kannada"
     case katakana = "Katakana"
     case katakanaOrHiragana = "Katakana_Or_Hiragana"
+    case kawi = "Kawi"
     case kayahLi = "Kayah_Li"
     case kharoshthi = "Kharoshthi"
     case khitanSmallScript = "Khitan_Small_Script"
@@ -98,6 +101,7 @@ extension Unicode {
     case lisu = "Lisu"
     case lycian = "Lycian"
     case lydian = "Lydian"
+    case kiratRai = "Kirat_Rai"
     case mahajani = "Mahajani"
     case makasar = "Makasar"
     case malayalam = "Malayalam"
@@ -117,6 +121,7 @@ extension Unicode {
     case multani = "Multani"
     case myanmar = "Myanmar"
     case nabataean = "Nabataean"
+    case nagMundari = "Nag_Mundari"
     case nandinagari = "Nandinagari"
     case newa = "Newa"
     case newTaiLue = "New_Tai_Lue"
@@ -134,6 +139,7 @@ extension Unicode {
     case oldSouthArabian = "Old_South_Arabian"
     case oldTurkic = "Old_Turkic"
     case oldUyghur = "Old_Uyghur"
+    case olOnal = "Ol_Onal"
     case oriya = "Oriya"
     case osage = "Osage"
     case osmanya = "Osmanya"
@@ -156,6 +162,7 @@ extension Unicode {
     case soraSompeng = "Sora_Sompeng"
     case soyombo = "Soyombo"
     case sundanese = "Sundanese"
+    case sunuwar = "Sunuwar"
     case sylotiNagri = "Syloti_Nagri"
     case syriac = "Syriac"
     case tagalog = "Tagalog"
@@ -173,7 +180,9 @@ extension Unicode {
     case tibetan = "Tibetan"
     case tifinagh = "Tifinagh"
     case tirhuta = "Tirhuta"
+    case todhri = "Todhri"
     case toto = "Toto"
+    case tuluTigalari = "Tulu_Tigalari"
     case ugaritic = "Ugaritic"
     case unknown = "Unknown"
     case vai = "Vai"