From e47c9d72faac3efcada8372f43026b4c12c93960 Mon Sep 17 00:00:00 2001 From: Dave Halter Date: Wed, 28 Jun 2017 18:13:57 +0200 Subject: [PATCH] Add some utf-8 tests. --- test/normalizer_issue_files/utf-8-bom.py | 6 ++++ test/normalizer_issue_files/utf-8.py | 35 ++++++++++++++++++++++++ 2 files changed, 41 insertions(+) create mode 100644 test/normalizer_issue_files/utf-8-bom.py create mode 100644 test/normalizer_issue_files/utf-8.py diff --git a/test/normalizer_issue_files/utf-8-bom.py b/test/normalizer_issue_files/utf-8-bom.py new file mode 100644 index 0000000..9c065c9 --- /dev/null +++ b/test/normalizer_issue_files/utf-8-bom.py @@ -0,0 +1,6 @@ +#!/usr/bin/env python +# -*- coding: utf-8 -*- + +hello = 'こんにちわ' + +# EOF diff --git a/test/normalizer_issue_files/utf-8.py b/test/normalizer_issue_files/utf-8.py new file mode 100644 index 0000000..e417cbc --- /dev/null +++ b/test/normalizer_issue_files/utf-8.py @@ -0,0 +1,35 @@ +# -*- coding: utf-8 -*- + +# Some random text with multi-byte characters (utf-8 encoded) +# +# Εδώ μάτσο κειμένων τη, τρόπο πιθανό διευθυντές ώρα μη. Νέων απλό παράγει ροή +# κι, το επί δεδομένη καθορίζουν. Πάντως ζητήσεις περιβάλλοντος ένα με, τη +# ξέχασε αρπάζεις φαινόμενο όλη. Τρέξει εσφαλμένη χρησιμοποίησέ νέα τι. Θα όρο +# πετάνε φακέλους, άρα με διακοπής λαμβάνουν εφαμοργής. Λες κι μειώσει +# καθυστερεί. + +# 79 narrow chars +# 01 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 [79] + +# 78 narrow chars (Na) + 1 wide char (W) +# 01 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8情 + +# 3 narrow chars (Na) + 40 wide chars (W) +# 情 情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情 + +# 3 narrow chars (Na) + 76 wide chars (W) +# 情 情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情 + +# +#: E501 +# 80 narrow chars (Na) +# 01 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 [80] +# +#: E501 +# 78 narrow chars (Na) + 2 wide char (W) +# 01 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8情情 +# +#: E501 +# 3 narrow chars (Na) + 77 wide chars (W) +# 情 情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情情 +#