root/libswish3/trunk/src/test_docs/UTF-8-demo.txt

Revision 1913, 13.7 kB (checked in by karpet, 2 years ago)

for all the world to see

Line 
1
2 UTF-8 encoded sample plain-text file
3 ‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟‟
4
5 Markus Kuhn [ˈmaʳkʊs kuːn] <http://www.cl.cam.ac.uk/~mgk25/> — 2002-07-25
6
7
8 The ASCII compatible UTF-8 encoding used in this plain-text file
9 is defined in Unicode, ISO 10646-1, and RFC 2279.
10
11
12 Using Unicode/UTF-8, you can write in emails and source code things such as
13
14 Mathematics and sciences:
15
16   ∮ Eâ‹
17 da = Q,  n → ∞, ∑ f(i) = ∏ g(i),      ⎧⎡⎛┌─────┐⎞⎀⎫
18                                             ⎪⎢⎜│a²+b³ ⎟⎥⎪
19   ∀x∈ℝ: ⌈x⌉ = −⌊−x⌋, α ∧ ¬β = ¬(¬α √ β),    ⎪⎢⎜│───── ⎟⎥⎪
20                                             ⎪⎢⎜⎷ c₈   âŽŸâŽ¥âŽª
21   ℕ ⊆ ℕ₀ ⊂ â„€ ⊂ ℚ ⊂ ℝ ⊂ ℂ,                   âŽšâŽ¢âŽœ       âŽŸâŽ¥âŽ¬
22                                             ⎪⎢⎜ ∞     âŽŸâŽ¥âŽª
23   ⊥ < a ≠ b ≡ c ≀ d ≪ ⊀ ⇒ (⟩A⟧ ⇔ ⟪B⟫),      ⎪⎢⎜ ⎲     âŽŸâŽ¥âŽª
24                                             ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪
25   2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm     âŽ©âŽ£âŽi=1    ⎠⎊⎭
26
27 Linguistics and dictionaries:
28
29   ði ıntəˈnÊʃənəl fəˈnɛtık əsoʊsiˈeıʃn
30   Y [ˈʏpsilɔn], Yen [jɛn], Yoga [ˈjoːgɑ]
31
32 APL:
33
34   ((V⍳V)=⍳⍎V)/V←,V    ⌷←⍳→⍎∆∇⊃‟⍎⍕⌈
35
36 Nicer typography in plain text files:
37
38   ╔══════════════════════════════════════════╗
39   ║                                          ║
40   ║   â€¢ ‘single’ and “double” quotes         â•‘
41   ║                                          ║
42   ║   â€¢ Curly apostrophes: “We’ve been here” ║
43   ║                                          ║
44   ║   â€¢ Latin-1 apostrophe and accents: 'ÂŽ`  ║
45   ║                                          ║
46   ║   â€¢ ‚deutsche‘ „AnfÃŒhrungszeichen“       â•‘
47   ║                                          ║
48   ║   â€¢ †, ‡, ‰, •, 3–4, —, −5/+5, ™, 
      ║
49   ║                                          ║
50   ║   â€¢ ASCII safety test: 1lI|, 0OD, 8B     â•‘
51   ║                      ╭─────────╮         â•‘
52   ║   â€¢ the euro symbol: │ 14.95 € │         â•‘
53   ║                      ╰─────────╯         â•‘
54   ╚══════════════════════════════════════════╝
55
56 Combining characters:
57
58   STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑
59
60 Greek (in Polytonic):
61
62   The Greek anthem:
63
64   Σᜲ γΜωρ᜷ζω ጀπ᜞ τᜎΜ κ᜹ψη
65   τοῊ σπαΞιοῊ τᜎΜ τροΌερ᜵,
66   σᜲ γΜωρ᜷ζω ጀπ᜞ τᜎΜ ᜄψη
67   πο᜺ Όᜲ β᜷α Όετρᜱει τᜎ γῆ.
68
69   ៿Απ៿ τᜰ κ᜹κκαλα βγαλΌᜳΜη
70   τῶΜ ῟Ελλ᜵ΜωΜ τᜰ ጱερᜱ
71   κα᜶ σᜰΜ πρῶτα ጀΜΎρειωΌᜳΜη
72   χαῖρε, ᜊ χαῖρε, ៿ΕλεÏ
73 Ξεριᜱ!
74
75   From a speech of Demosthenes in the 4th century BC:
76
77   Οᜐχ᜶ ταᜐτᜰ παρ᜷στατα᜷ Όοι γιγΜ᜜σκειΜ, ᜊ ጄΜΎρες ៿ΑΞηΜαῖοι,
78   áœ
79 ταΜ τ៿ εጰς τᜰ πρᜱγΌατα ጀποβλᜳψω κα᜶ áœ
80 ταΜ πρ᜞ς το᜺ς
81   λ᜹γοÏ
82 ς οᜓς ጀκο᜻ω· το᜺ς ΌᜲΜ γᜰρ λ᜹γοÏ
83 ς περ᜶ τοῊ
84   τιΌωρ᜵σασΞαι Ί᜷λιπποΜ ᜁρῶ γιγΜοΌᜳΜοÏ
85 ς, τᜰ Ύᜲ πρᜱγΌατ៿
86   εጰς τοῊτο προ᜵κοΜτα,  ᜥσΞ៿ áœ
87 πως Όᜎ πεισ᜹ΌεΞ៿ αᜐτο᜶
88   πρ᜹τεροΜ κακῶς σκᜳψασΞαι ΎᜳοΜ. οᜐΎᜳΜ ο᜖Μ ጄλλο Όοι ΎοκοῊσιΜ
89   οጱ τᜰ τοιαῊτα λᜳγοΜτες ጢ τᜎΜ ᜑπ᜹ΞεσιΜ, περ᜶ ጧς βοÏ
90 λε᜻εσΞαι,
91   οᜐχ᜶ τᜎΜ ο᜖σαΜ παριστᜱΜτες ᜑΌῖΜ ጁΌαρτᜱΜειΜ. ጐγᜌ Ύᜳ, áœ
92 τι ΌᜳΜ
93   ποτ៿ ጐΟῆΜ τῇ π᜹λει κα᜶ τᜰ αᜑτῆς ጔχειΜ ጀσφαλῶς κα᜶ Ί᜷λιπποΜ
94   τιΌωρ᜵σασΞαι, κα᜶ Όᜱλ៿ ጀκριβῶς οጶΎα· ጐπ៿ ጐΌοῊ γᜱρ, οᜐ πᜱλαι
95   γᜳγοΜεΜ ταῊτ៿ ጀΌφ᜹τερα· ΜῊΜ ΌᜳΜτοι πᜳπεισΌαι τοῊΞ៿ ጱκαΜ᜞Μ
96   προλαβεῖΜ ጡΌῖΜ εጶΜαι τᜎΜ πρ᜜τηΜ, áœ
97 πως το᜺ς σÏ
98 ΌΌᜱχοÏ
99 ς
100   σ᜜σοΌεΜ. ጐᜰΜ γᜰρ τοῊτο βεβα᜷ως ᜑπᜱρΟῃ, τ᜹τε κα᜶ περ᜶ τοῊ
101   τ᜷Μα τιΌωρ᜵σετα᜷ τις κα᜶ ᜃΜ τρ᜹ποΜ ጐΟᜳσται σκοπεῖΜ· πρ᜶Μ Ύᜲ
102   τᜎΜ ጀρχᜎΜ ᜀρΞῶς ᜑποΞᜳσΞαι, ΌᜱταιοΜ ጡγοῊΌαι περ᜶ τῆς
103   τελεÏ
104 τῆς ᜁΜτιΜοῊΜ ποιεῖσΞαι λ᜹γοΜ.
105
106   ΔηΌοσΞᜳΜοÏ
107 ς, Γ῜ ៿ΟλÏ
108 ΜΞιακ᜞ς
109
110 Georgian:
111
112   From a Unicode conference invitation:
113
114   გთხოვთ ახლავე გაიაროთ რეგისტრაცია Unicode-ის მეათე საერთალორისო
115   კონჀერენციაზე დასასწრებად, რომელიც გაიმართება 10-12 მარტს,
116   ქ. მაინცლი, გერმანიაჹი. კონჀერენცია ლეჰკრებს ერთად მსოჀლიოს
117   ექსპერტებს ისეთ დარგებჹი როგორიცაა ინტერნეტი და Unicode-ი,
118   ინტერნაციონალიზაცია და ლოკალიზაცია, Unicode-ის გამოყენება
119   ოპერაციულ სისტემებსა, და გამოყენებით პროგრამებჹი, ლრიჀტებლი,
120   ტექსტების დამულავებასა და მრავალენოვან კომპიუტერულ სისტემებლი.
121
122 Russian:
123
124   From a Unicode conference invitation:
125
126   ЗарегОстрОруйтесь сейчас Ма Десятую МежЎуМарПЎМую КПМфереМцОю пП
127   Unicode, кПтПрая сПстПОтся 10-12 Ќарта 1997 гПЎа в МайМце в ГерЌаМОО.
128   КПМфереМцОя сПберет шОрПкОй круг экспертПв пП  вПпрПсаЌ глПбальМПгП
129   ИМтерМета О Unicode, лПкалОзацОО О ОМтерМацОПМалОзацОО, вПплПщеМОю О
130   прОЌеМеМОю Unicode в разлОчМыÑ
131  ÐŸÐ¿ÐµÑ€Ð°Ñ†ÐžÐŸÐœÐœÑ‹Ñ
132  ÑÐžÑÑ‚еЌаÑ
133  Ðž прПграЌЌМыÑ
134
135   прОлПжеМОяÑ
136 , шрОфтаÑ
137 , верстке О ЌМПгПязычМыÑ
138  ÐºÐŸÐŒÐ¿ÑŒÑŽÑ‚ерМыÑ
139  ÑÐžÑÑ‚еЌаÑ
140 .
141
142 Thai (UCS Level 2):
143
144   Excerpt from a poetry on The Romance of The Three Kingdoms (a Chinese
145   classic 'San Gua'):
146
147   [----------------------------|------------------------]
148     ๏ à¹àžœà¹ˆàž™àž”àžŽàž™àž®àž±à¹ˆàž™à¹€àžªàž·à¹ˆàž­àž¡à¹‚àž—àž£àž¡à¹àžªàž™àžªàž±àž‡à¹€àž§àžŠ  àžžàž£àž°àž›àžà¹€àžàžšàžàž­àž‡àžšàž¹à¹Šàžàž¹à¹‰àž‚àž¶à¹‰àž™à¹ƒàž«àž¡à¹ˆ
149   àžªàžŽàžšàžªàž­àž‡àžàž©àž±àž•àž£àžŽàž¢à¹Œàžà¹ˆàž­àž™àž«àž™à¹‰àž²à¹àž¥àž–àž±àž”à¹„àž›       àžªàž­àž‡àž­àž‡àž„à¹Œà¹„àž‹àž£à¹‰à¹‚àž‡à¹ˆà¹€àž‚àž¥àž²à¹€àžšàž²àž›àž±àžàžàž²
150     àž—àž£àž‡àž™àž±àžšàž–àž·àž­àž‚àž±àž™àž—àžµà¹€àž›à¹‡àž™àž—àžµà¹ˆàžžàž¶à¹ˆàž‡           àžšà¹‰àž²àž™à¹€àž¡àž·àž­àž‡àžˆàž¶àž‡àž§àžŽàž›àž£àžŽàž•à¹€àž›à¹‡àž™àž™àž±àžàž«àž™àž²
151   à¹‚àž®àžˆàžŽà¹‹àž™à¹€àž£àžµàž¢àžàž—àž±àžžàž—àž±à¹ˆàž§àž«àž±àž§à¹€àž¡àž·àž­àž‡àž¡àž²         àž«àž¡àž²àž¢àžˆàž°àž†à¹ˆàž²àž¡àž”àžŠàž±à¹ˆàž§àž•àž±àž§àžªàž³àž„àž±àž
152     à¹€àž«àž¡àž·àž­àž™àž‚àž±àžšà¹„àžªà¹„àž¥à¹ˆà¹€àžªàž·àž­àžˆàž²àžà¹€àž„àž«àž²      àž£àž±àžšàž«àž¡àž²àž›à¹ˆàž²à¹€àž‚à¹‰àž²àž¡àž²à¹€àž¥àž¢àž­àž²àžªàž±àž
153   àžà¹ˆàž²àž¢àž­à¹‰àž­àž‡àž­àžžà¹‰àž™àž¢àžžà¹àž¢àžà¹ƒàž«à¹‰à¹àž•àžàžàž±àž™          à¹ƒàžŠà¹‰àžªàž²àž§àž™àž±à¹‰àž™à¹€àž›à¹‡àž™àžŠàž™àž§àž™àžŠàž·à¹ˆàž™àžŠàž§àž™à¹ƒàžˆ
154     àžžàž¥àž±àž™àž¥àžŽàž‰àžžàž¢àžàžžàž¢àžàžµàžàž¥àž±àžšàžà¹ˆàž­à¹€àž«àž•àžž          àžŠà¹ˆàž²àž‡àž­àž²à¹€àžžàžšàžˆàž£àžŽàž‡àž«àž™àž²àžŸà¹‰àž²àž£à¹‰àž­àž‡à¹„àž«à¹‰
155   àž•à¹‰àž­àž‡àž£àžšàž£àž²àž†à¹ˆàž²àžŸàž±àž™àžˆàž™àžšàž£àž£àž¥àž±àž¢           àž€à¹
156 àž«àž²à¹ƒàž„àž£àž„à¹‰àž³àžŠàž¹àžàž¹à¹‰àžšàž£àž£àž¥àž±àž‡àžà¹Œ àž¯
157
158   (The above is a two-column text. If combining characters are handled
159   correctly, the lines of the second column should be aligned with the
160   | character above.)
161
162 Ethiopian:
163
164   Proverbs in the Amharic language:
165
166   ሰማይ አይታሚስ ንጉሥ አይኚሰስ።
167   ብላ ካለኝ እንደአባ቎ በቆመጠኝ።
168   ጌጥ ያለቀቱ ቁምጥና ነው።
169   ደሀ በሕልሙ á‰
170 ቀ ባይጠጣ ንጣት በገደለው።
171   ዹአፍ ወለምታ በá‰
172 ቀ አይታሜም።
173   አይጥ በበላ ዳዋ ተመታ።
174   ሲተሚጉሙ ይደሚግሙ።
175   ቀስ በቀስ፥ ዕንቁላል በእግሩ ይሄዳል።
176   ድር ቢያብር አንበሳ ያስር።
177   ሰው እንደቀቱ እንáŒ
178  áŠ¥áŠ•á‹° ጉሚቀቱ አይተዳደርም።
179   እግዜር ዹኹፈተውን ጉሮሮ ሳይዘጋው አይድርም።
180   ዚጎሚቀት ሌባ፥ ቢያዩት ይስá‰
181  á‰£á‹«á‹©á‰µ ያጠልá‰
182 ።
183   ሥራ ኚመፍታት ልጄን ላፋታት።
184   ዓባይ ማደሪያ ዚለው፥ ግንድ ይዞ ይዞራል።
185   ዚእስላም አገሩ መካ ዚአሞራ አገሩ ዋርካ።
186   ተንጋሎ ቢተፉ ተመልሶ ባፉ።
187   ወዳáŒ
188 áˆ
189  áˆ›áˆ­ ቢሆን ጚርስáˆ
190  áŠ á‰µáˆ‹áˆ°á‹á¢
191   እግርáˆ
192 ን በፍራሜáˆ
193  áˆáŠ­ ዘርጋ።
194
195 Runes:
196
197   ᚻᛖ ᚳᚹᚫᚊ ᚊᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩ᚟ ᚊᚫᛗ ᛚᚪ᚟ᛞᛖ ᚟ᚩᚱᚊᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚊ ᚊᚪ ᚹᛖᛥᚫ
198
199   (Old English, which transcribed into Latin reads 'He cwaeth that he
200   bude thaem lande northweardum with tha Westsae.' and means 'He said
201   that he lived in the northern land near the Western Sea.')
202
203 Braille:
204
205   ⡌⠁⠧⠑ ⠌⠁⠒  ⡍⠜⠇⠑⠹⠰⠎ ⡣⠕⠌
206
207   ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠙⠑⠁⠙⠒ ⠞⠕ ⠃⠑⠛⠔ ⠺⠊⠹⠲ ⡹⠻⠑ ⠊⠎ ⠝⠕ ⠙⠳⠃⠞
208   ⠱⠁⠞⠑⠧⠻ ⠁⠃⠳⠞ ⠹⠁⠞⠲ ⡹⠑ ⠗⠑⠛⠊⠌⠻ ⠕⠋ ⠙⠊⠎ ⠃⠥⠗⠊⠁⠇ ⠺⠁⠎
209   ⠎⠊⠛⠝⠫ ⠃⠹ ⠹⠑ ⠊⠇⠻⠛⠹⠍⠁⠝⠂ ⠹⠑ ⠊⠇⠻â 
210 ⠂ ⠹⠑ ⠥⠝⠙⠻⠞⠁â 
211 ⠻⠂
212   ⠁⠝⠙ ⠹⠑ ⠡⠊⠑⠋ ⠍⠳⠗⠝⠻⠲ ⡎⠊⠗⠕⠕⠛⠑ ⠎⠊⠛⠝⠫ ⠊⠞⠲ ⡁⠝⠙
213   ⡎⠊⠗⠕⠕⠛⠑⠰⠎ ⠝⠁⠍⠑ ⠺⠁⠎ ⠛⠕⠕⠙ ⠥⠏⠕⠝ ⠰⡡⠁⠝⠛⠑⠂ ⠋⠕⠗ ⠁⠝⠹⠹⠔⠛ ⠙⠑
214   ⠡⠕⠎⠑ ⠞⠕ ⠏⠥⠞ ⠙⠊⠎ ⠙⠁⠝⠙ ⠞⠕⠲
215
216   ⡕⠇⠙ ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠀⠝⠁⠊⠇⠲
217
218   ⡍⠔⠙⠖ ⡊ ⠙⠕⠝⠰⠞ ⠍⠑⠁⠝ ⠞⠕ ⠎⠁⠹ ⠹⠁⠞ ⡊ â 
219 ⠝⠪⠂ ⠕⠋ ⠍⠹
220   ⠪⠝ â 
221 ⠝⠪⠇⠫⠛⠑⠂ ⠱⠁⠞ ⠹⠻⠑ ⠊⠎ ⠏⠜⠞⠊⠊⠥⠇⠜⠇⠹ ⠙⠑⠁⠙ ⠁⠃⠳⠞
222   ⠁ ⠙⠕⠕⠗⠀⠝⠁⠊⠇⠲ ⡊ ⠍⠊⠣⠞ ⠙⠁⠧⠑ ⠃⠑⠲ ⠔⠊⠇⠔⠫⠂ ⠍⠹⠎⠑⠇⠋⠂ ⠞⠕
223   ⠗⠑⠛⠜⠙ ⠁ ⠊⠕⠋⠋⠔⠀⠝⠁⠊⠇ ⠁⠎ ⠹⠑ ⠙⠑⠁⠙⠑⠌ ⠏⠊⠑⠊⠑ ⠕⠋ ⠊⠗⠕⠝⠍⠕⠝⠛⠻⠹
224   ⠔ ⠹⠑ ⠞⠗⠁⠙⠑⠲ ⡃⠥⠞ ⠹⠑ ⠺⠊⠎⠙⠕⠍ ⠕⠋ ⠳⠗ ⠁⠝⠊⠑⠌⠕⠗⠎
225   ⠊⠎ ⠔ ⠹⠑ ⠎⠊⠍⠊⠇⠑⠆ ⠁⠝⠙ ⠍⠹ ⠥⠝⠙⠁⠇⠇⠪⠫ ⠙⠁⠝⠙⠎
226   ⠩⠁⠇⠇ ⠝⠕⠞ ⠙⠊⠌⠥⠗⠃ ⠊⠞⠂ ⠕⠗ ⠹⠑ ⡊⠳⠝⠞⠗⠹⠰⠎ ⠙⠕⠝⠑ ⠋⠕⠗⠲ ⡹⠳
227   ⠺⠊⠇⠇ ⠹⠻⠑⠋⠕⠗⠑ ⠏⠻⠍⠊⠞ ⠍⠑ ⠞⠕ ⠗⠑⠏⠑⠁⠞⠂ ⠑⠍⠏⠙⠁⠞⠊⠊⠁⠇⠇⠹⠂ ⠹⠁⠞
228   ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠀⠝⠁⠊⠇⠲
229
230   (The first couple of paragraphs of "A Christmas Carol" by Dickens)
231
232 Compact font selection example text:
233
234   ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789
235   abcdefghijklmnopqrstuvwxyz £©µÀÆÖÞßéöÿ
236   –—‘“”„†• ‰™œŠŞş€ ΑΒΓΔΩαβγΎω АБВГДабвгЎ
237   ∀∂∈ℝ∧∪≡∞ ↑↗↚↻⇣ ┐┌╔╘░►☺♀ fiᅵ⑀₂ጠគӥẄɐː⍎אԱა
238
239 Greetings in various languages:
240
241   Hello world, ΚαληΌᜳρα κ᜹σΌε, コンニチハ
242
243 Box drawing alignment tests:                                          █
244                                                                       ▉
245   ╔══╩══╗  ┌──┬──┐  ╭──┬──╮  ╭──┬──╮  ┏━━┳━━┓  ┎┒┏┑   â•·  ╻ ┏┯┓ ┌┰┐    ▊ ╱╲╱╲╳╳╳
246   ║┌─╹─┐║  │╔═╧═╗│  │╒═╪═╕│  │╓─╁─╖│  ┃┌─╂─┐┃  ┗╃╄┙  ╶┌╎╺╋╞┠┌┚ ┝╋┥    ▋ ╲╱╲╱╳╳╳
247   ║│╲ ╱│║  │║   â•‘│  ││ │ ││  │║ ┃ ║│  ┃│ ╿ │┃  ┍â•
248 ╆┓   â•µ  ╹ ┗┷┛ └┾┘    ▌ ╱╲╱╲╳╳╳
249   ╠╡ ╳ ╞╣  ├╢   â•Ÿâ”€  ├┌─┌─┌─  ├╫─╂─╫─  ┣┿╟┌╌┿┫  ┕┛┖┚     â”Œâ”„┄┐ ╎ ┏â”
250 â”
251 ┓ ┋ ▍ ╲╱╲╱╳╳╳
252   ║│╱ ╲│║  │║   â•‘│  ││ │ ││  │║ ┃ ║│  ┃│ ╜ │┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▎
253   ║└─╥─┘║  │╚═╀═╝│  │╘═╪═╛│  │╙─╀─╜│  ┃└─╂─┘┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▏
254   ╚══╩══╝  └──┮──┘  ╰──┎──╯  ╰──┎──╯  ┗━━┻━━┛  ▗▄▖▛▀▜   â””╌╌┘ ╎ ┗╍╍┛ ┋  ▁▂▃▄â–
255 ▆▇█
256                                                â–â–€â–˜â–™â–„â–Ÿ
Note: See TracBrowser for help on using the browser.