Revision: 8662
Author: xqt
Date: 2010-10-17 21:12:25 +0000 (Sun, 17 Oct 2010)
Log Message:
-----------
update from trunk r8661
Modified Paths:
--------------
branches/rewrite/pywikibot/families/wikipedia_family.py
branches/rewrite/pywikibot/family.py
branches/rewrite/pywikibot/textlib.py
Modified: branches/rewrite/pywikibot/families/wikipedia_family.py
===================================================================
--- branches/rewrite/pywikibot/families/wikipedia_family.py 2010-10-17 21:05:10 UTC (rev
8661)
+++ branches/rewrite/pywikibot/families/wikipedia_family.py 2010-10-17 21:12:25 UTC (rev
8662)
@@ -11,31 +11,31 @@
self.name = 'wikipedia'
self.languages_by_size = [
- 'en', 'de', 'fr', 'pl', 'it',
'ja', 'es', 'nl', 'pt', 'ru', 'sv',
+ 'en', 'de', 'fr', 'it', 'pl',
'ja', 'es', 'nl', 'pt', 'ru', 'sv',
'zh', 'ca', 'no', 'fi', 'uk',
'hu', 'cs', 'ro', 'tr', 'ko', 'da',
- 'ar', 'eo', 'sr', 'id', 'vi',
'lt', 'vo', 'sk', 'he', 'bg', 'fa',
+ 'ar', 'eo', 'sr', 'vi', 'id',
'lt', 'vo', 'sk', 'he', 'bg', 'fa',
'sl', 'war', 'hr', 'et', 'ms',
'new', 'simple', 'gl', 'th',
'roa-rup', 'nn', 'eu', 'hi', 'el',
'ht', 'te', 'la', 'ka', 'ceb',
'mk', 'az', 'tl', 'br', 'sh',
'mr', 'lb', 'jv', 'lv', 'bs', 'is',
'cy', 'pms', 'be-x-old', 'sq', 'ta',
'bpy', 'be', 'an', 'oc', 'bn',
- 'sw', 'io', 'ksh', 'lmo', 'fy',
'gu', 'nds', 'af', 'qu', 'scn',
+ 'sw', 'io', 'ksh', 'lmo', 'fy',
'gu', 'nds', 'af', 'scn', 'qu',
'ku', 'ur', 'su', 'ml', 'zh-yue',
'ast', 'nap', 'bat-smg', 'wa',
'ga', 'cv', 'hy', 'yo', 'kn',
'tg', 'roa-tara', 'vec', 'pnb', 'gd',
'yi', 'ne', 'zh-min-nan', 'uz', 'tt',
'pam', 'os', 'sah', 'als',
'mi', 'arz', 'kk', 'nah', 'li',
'hsb', 'glk', 'co', 'gan', 'am',
'ia', 'mn', 'bcl', 'fiu-vro',
'nds-nl', 'fo', 'tk', 'vls', 'sco',
- 'si', 'sa', 'bar', 'gv', 'dv',
'my', 'nrm', 'pag', 'rm', 'map-bms',
+ 'si', 'sa', 'bar', 'my', 'gv',
'dv', 'nrm', 'pag', 'rm', 'map-bms',
'diq', 'ckb', 'se', 'mzn', 'wuu',
'ug', 'fur', 'lij', 'mt', 'bh',
- 'nov', 'mg', 'csb', 'ilo', 'sc',
'km', 'zh-classical', 'lad', 'pi',
+ 'nov', 'mg', 'csb', 'ilo', 'sc',
'zh-classical', 'km', 'lad', 'pi',
'ang', 'cbk-zam', 'bo', 'hif', 'frp',
'hak', 'kw', 'pa', 'ps',
- 'xal', 'szl', 'pdc', 'haw', 'ie',
'stq', 'nv', 'crh', 'fj', 'kv',
+ 'xal', 'szl', 'pdc', 'haw', 'stq',
'ie', 'nv', 'crh', 'fj', 'kv',
'to', 'ace', 'so', 'myv', 'gn',
'krc', 'ln', 'ext', 'ky', 'mhr',
- 'arc', 'eml', 'jbo', 'wo', 'ay',
'pcd', 'kab', 'frr', 'tum', 'ba',
+ 'arc', 'eml', 'jbo', 'wo', 'pcd',
'ay', 'tum', 'kab', 'frr', 'ba',
'ty', 'tpi', 'pap', 'zea', 'srn',
'kl', 'udm', 'ce', 'ig', 'or',
- 'dsb', 'kg', 'lo', 'ab', 'rmy',
'mdf', 'cu', 'mwl', 'kaa', 'sm',
- 'tet', 'av', 'sn', 'ks', 'got',
'sd', 'bm', 'na', 'pih', 'pnt',
+ 'dsb', 'kg', 'lo', 'ab', 'mdf',
'rmy', 'cu', 'mwl', 'kaa', 'sm',
+ 'tet', 'av', 'sn', 'got', 'ks',
'sd', 'bm', 'na', 'pih', 'pnt',
'iu', 'ik', 'chr', 'bi', 'as',
'cdo', 'ee', 'ss', 'om', 'za', 'ti',
- 'ts', 'zu', 've', 'ha', 'dz',
'sg', 'ch', 'cr', 'ak', 'xh', 'st',
+ 'ts', 've', 'zu', 'ha', 'dz',
'sg', 'ch', 'cr', 'ak', 'xh', 'st',
'rw', 'tn', 'ki', 'bxr', 'bug',
'ny', 'lbe', 'tw', 'rn', 'ff',
'chy', 'lg',
]
@@ -329,33 +329,33 @@
self.alphabetic_latin = [
'ace', 'af', 'ak', 'als', 'am',
'ang', 'ab', 'ar', 'an', 'arc',
- 'roa-rup', 'frp', 'arz', 'as', 'ast',
'gn', 'av', 'ay', 'az', 'id',
- 'ms', 'bg', 'bm', 'zh-min-nan',
'nan', 'map-bms', 'jv', 'su', 'ba',
- 'be', 'be-x-old', 'bh', 'bcl', 'bi',
'bn', 'bo', 'bar', 'bs', 'bpy',
- 'br', 'bug', 'bxr', 'ca', 'ceb',
'ch', 'cbk-zam', 'sn', 'tum', 'ny',
- 'cho', 'chr', 'co', 'cy', 'cv',
'cs', 'da', 'dk', 'pdc', 'de', 'nv',
- 'dsb', 'na', 'dv', 'dz', 'mh',
'et', 'el', 'eml', 'en', 'myv', 'es',
- 'eo', 'ext', 'eu', 'ee', 'fa',
'hif', 'fo', 'fr', 'fy', 'ff', 'fur',
- 'ga', 'gv', 'sm', 'gd', 'gl',
'gan', 'ki', 'glk', 'got', 'gu', 'ha',
- 'hak', 'xal', 'haw', 'he', 'hi',
'ho', 'hsb', 'hr', 'hy', 'io',
- 'ig', 'ii', 'ilo', 'ia', 'ie',
'iu', 'ik', 'os', 'xh', 'zu', 'is',
- 'it', 'ja', 'ka', 'kl', 'kr',
'pam', 'krc', 'csb', 'kk', 'kw', 'rw',
- 'ky', 'rn', 'sw', 'km', 'kn',
'ko', 'kv', 'kg', 'ht', 'ks', 'ku',
- 'kj', 'lad', 'lbe', 'la', 'lv',
'to', 'lb', 'lt', 'lij', 'li', 'ln',
- 'lo', 'jbo', 'lg', 'lmo', 'hu',
'mk', 'mg', 'mt', 'mi', 'cdo',
- 'mwl', 'ml', 'mdf', 'mo', 'mn',
'mr', 'mus', 'my', 'mzn', 'nah',
- 'fj', 'ne', 'nl', 'nds-nl', 'cr',
'new', 'nap', 'ce', 'frr', 'pih',
- 'no', 'nb', 'nn', 'nrm', 'nov',
'oc', 'mhr', 'or', 'om', 'ng', 'hz',
- 'uz', 'pa', 'pag', 'pap', 'pi',
'pcd', 'pms', 'nds', 'pnb', 'pl',
- 'pt', 'pnt', 'ps', 'aa', 'kaa',
'crh', 'ty', 'ksh', 'ro', 'rmy',
- 'rm', 'qu', 'ru', 'sa', 'sah',
'se', 'sg', 'sc', 'sco', 'sd', 'stq',
- 'st', 'tn', 'sq', 'si', 'scn',
'simple', 'ss', 'sk', 'sl', 'cu',
- 'szl', 'so', 'ckb', 'srn', 'sr',
'sh', 'fi', 'sv', 'ta', 'tl',
- 'kab', 'roa-tara', 'tt', 'te', 'tet',
'th', 'ti', 'vi', 'tg',
- 'tokipona', 'tp', 'tpi', 'chy', 've',
'tr', 'tk', 'tw', 'udm', 'uk',
- 'ur', 'ug', 'za', 'vec', 'vo',
'fiu-vro', 'wa', 'vls', 'war', 'wo',
- 'wuu', 'ts', 'yi', 'yo', 'diq',
'zea', 'zh', 'zh-tw', 'zh-cn',
- 'zh-classical', 'zh-yue', 'bat-smg',
+ 'roa-rup', 'frp', 'arz', 'as', 'ast',
'gn', 'av', 'ay', 'az', 'bjn',
+ 'id', 'ms', 'bg', 'bm', 'zh-min-nan',
'nan', 'map-bms', 'jv', 'su',
+ 'ba', 'be', 'be-x-old', 'bh', 'bcl',
'bi', 'bn', 'bo', 'bar', 'bs',
+ 'bpy', 'br', 'bug', 'bxr', 'ca',
'ceb', 'ch', 'cbk-zam', 'sn',
+ 'tum', 'ny', 'cho', 'chr', 'co',
'cy', 'cv', 'cs', 'da', 'dk',
+ 'pdc', 'de', 'nv', 'dsb', 'na',
'dv', 'dz', 'mh', 'et', 'el', 'eml',
+ 'en', 'myv', 'es', 'eo', 'ext',
'eu', 'ee', 'fa', 'hif', 'fo', 'fr',
+ 'fy', 'ff', 'fur', 'ga', 'gv',
'sm', 'gd', 'gl', 'gan', 'ki', 'glk',
+ 'got', 'gu', 'ha', 'hak', 'xal',
'haw', 'he', 'hi', 'ho', 'hsb',
+ 'hr', 'hy', 'io', 'ig', 'ii',
'ilo', 'ia', 'ie', 'iu', 'ik', 'os',
+ 'xh', 'zu', 'is', 'it', 'ja',
'ka', 'kl', 'kr', 'pam', 'krc', 'csb',
+ 'kk', 'kw', 'rw', 'ky', 'rn',
'sw', 'km', 'kn', 'ko', 'koi', 'kv',
+ 'kg', 'ht', 'ks', 'ku', 'kj',
'lad', 'lbe', 'la', 'lv', 'to', 'lb',
+ 'lt', 'lij', 'li', 'ln', 'lo',
'jbo', 'lg', 'lmo', 'hu', 'mk', 'mg',
+ 'mt', 'mi', 'cdo', 'mwl', 'ml',
'mdf', 'mo', 'mn', 'mr', 'mus',
+ 'my', 'mzn', 'nah', 'fj', 'ne',
'nl', 'nds-nl', 'cr', 'new', 'nap',
+ 'ce', 'frr', 'pih', 'no', 'nb',
'nn', 'nrm', 'nov', 'oc', 'mrj',
+ 'mhr', 'or', 'om', 'ng', 'hz',
'uz', 'pa', 'pag', 'pap', 'pi',
+ 'pcd', 'pms', 'nds', 'pnb', 'pl',
'pt', 'pnt', 'ps', 'aa', 'kaa',
+ 'crh', 'ty', 'ksh', 'ro', 'rmy',
'rm', 'qu', 'ru', 'sa', 'sah',
+ 'se', 'sg', 'sc', 'sco', 'sd',
'stq', 'st', 'tn', 'sq', 'si', 'scn',
+ 'simple', 'ss', 'sk', 'sl', 'cu',
'szl', 'so', 'ckb', 'srn', 'sr',
+ 'sh', 'fi', 'sv', 'ta', 'tl',
'kab', 'roa-tara', 'tt', 'te', 'tet',
+ 'th', 'ti', 'vi', 'tg', 'tokipona',
'tp', 'tpi', 'chy', 've', 'tr',
+ 'tk', 'tw', 'udm', 'uk', 'ur',
'ug', 'za', 'vec', 'vo', 'fiu-vro',
+ 'wa', 'vls', 'war', 'wo', 'wuu',
'ts', 'yi', 'yo', 'diq', 'zea',
+ 'zh', 'zh-tw', 'zh-cn', 'zh-classical',
'zh-yue', 'bat-smg',
]
# Which languages have a special order for putting interlanguage links,
Modified: branches/rewrite/pywikibot/family.py
===================================================================
--- branches/rewrite/pywikibot/family.py 2010-10-17 21:05:10 UTC (rev 8661)
+++ branches/rewrite/pywikibot/family.py 2010-10-17 21:12:25 UTC (rev 8662)
@@ -25,66 +25,67 @@
# Updated from
http://meta.wikimedia.org/wiki/Interwiki_sorting_order
self.alphabetic = [
'ace', 'af', 'ak', 'als', 'am',
'ang', 'ab', 'ar', 'an', 'arc',
- 'roa-rup', 'frp', 'as', 'ast', 'gn',
'av', 'ay', 'az', 'bm', 'bn',
- 'zh-min-nan', 'nan', 'map-bms', 'ba',
'be', 'be-x-old', 'bh', 'bcl',
- 'bi', 'bar', 'bo', 'bs', 'br',
'bg', 'bxr', 'ca', 'cv', 'ceb', 'cs',
- 'ch', 'cbk-zam', 'ny', 'sn', 'tum',
'cho', 'co', 'cy', 'da', 'dk',
- 'pdc', 'de', 'dv', 'nv', 'dsb',
'dz', 'mh', 'et', 'el', 'eml', 'en',
- 'myv', 'es', 'eo', 'ext', 'eu',
'ee', 'fa', 'hif', 'fo', 'fr', 'fy',
- 'ff', 'fur', 'ga', 'gv', 'gd',
'gl', 'gan', 'ki', 'glk', 'gu',
- 'got', 'hak', 'xal', 'ko', 'ha',
'haw', 'hy', 'hi', 'ho', 'hsb',
- 'hr', 'io', 'ig', 'ilo', 'bpy',
'id', 'ia', 'ie', 'iu', 'ik', 'os',
- 'xh', 'zu', 'is', 'it', 'he',
'jv', 'kl', 'kn', 'kr', 'pam', 'krc',
- 'ka', 'ks', 'csb', 'kk', 'kw',
'rw', 'ky', 'rn', 'sw', 'kv', 'kg',
- 'ht', 'ku', 'kj', 'lad', 'lbe',
'lo', 'la', 'lv', 'lb', 'lt', 'lij',
- 'li', 'ln', 'jbo', 'lg', 'lmo',
'hu', 'mk', 'mg', 'ml', 'mt', 'mi',
- 'mr', 'arz', 'mzn', 'ms', 'cdo',
'mwl', 'mdf', 'mo', 'mn', 'mus',
- 'my', 'nah', 'na', 'fj', 'nl',
'nds-nl', 'cr', 'ne', 'new', 'ja',
- 'nap', 'ce', 'frr', 'pih', 'no',
'nb', 'nn', 'nrm', 'nov', 'ii',
- 'oc', 'mhr', 'or', 'om', 'ng',
'hz', 'uz', 'pa', 'pi', 'pag', 'pnb',
- 'pap', 'ps', 'km', 'pcd', 'pms',
'tpi', 'nds', 'pl', 'tokipona',
- 'tp', 'pnt', 'pt', 'aa', 'kaa',
'crh', 'ty', 'ksh', 'ro', 'rmy',
- 'rm', 'qu', 'ru', 'sah', 'se',
'sm', 'sa', 'sg', 'sc', 'sco', 'stq',
- 'st', 'tn', 'sq', 'scn', 'si',
'simple', 'sd', 'ss', 'sk', 'cu',
- 'sl', 'szl', 'so', 'ckb', 'srn',
'sr', 'sh', 'su', 'fi', 'sv', 'tl',
- 'ta', 'kab', 'roa-tara', 'tt', 'te',
'tet', 'th', 'ti', 'tg', 'to',
- 'chr', 'chy', 've', 'tr', 'tk',
'tw', 'udm', 'bug', 'uk', 'ur',
- 'ug', 'za', 'vec', 'vi', 'vo',
'fiu-vro', 'wa', 'zh-classical',
- 'vls', 'war', 'wo', 'wuu', 'ts',
'yi', 'yo', 'zh-yue', 'diq', 'zea',
- 'bat-smg', 'zh', 'zh-tw', 'zh-cn',
+ 'roa-rup', 'frp', 'as', 'ast', 'gn',
'av', 'ay', 'az', 'bm', 'bnj',
+ 'bn', 'zh-min-nan', 'nan', 'map-bms',
'ba', 'be', 'be-x-old', 'bh',
+ 'bcl', 'bi', 'bar', 'bo', 'bs',
'br', 'bg', 'bxr', 'ca', 'cv',
+ 'ceb', 'cs', 'ch', 'cbk-zam', 'ny',
'sn', 'tum', 'cho', 'co', 'cy',
+ 'da', 'dk', 'pdc', 'de', 'dv',
'nv', 'dsb', 'dz', 'mh', 'et', 'el',
+ 'eml', 'en', 'myv', 'es', 'eo',
'ext', 'eu', 'ee', 'fa', 'hif',
+ 'fo', 'fr', 'fy', 'ff', 'fur',
'ga', 'gv', 'gd', 'gl', 'gan', 'ki',
+ 'glk', 'gu', 'got', 'hak', 'xal',
'ko', 'ha', 'haw', 'hy', 'hi',
+ 'ho', 'hsb', 'hr', 'io', 'ig',
'ilo', 'bpy', 'id', 'ia', 'ie', 'iu',
+ 'ik', 'os', 'xh', 'zu', 'is',
'it', 'he', 'jv', 'kl', 'kn', 'kr',
+ 'pam', 'krc', 'ka', 'ks', 'csb',
'kk', 'kw', 'rw', 'ky', 'rn', 'sw',
+ 'koi', 'kv', 'kg', 'ht', 'ku',
'kj', 'lad', 'lbe', 'lo', 'la', 'lv',
+ 'lb', 'lt', 'lij', 'li', 'ln',
'jbo', 'lg', 'lmo', 'hu', 'mk', 'mg',
+ 'ml', 'mt', 'mi', 'mr', 'arz',
'mzn', 'ms', 'cdo', 'mwl', 'mdf',
+ 'mo', 'mn', 'mus', 'my', 'nah',
'na', 'fj', 'nl', 'nds-nl', 'cr',
+ 'ne', 'new', 'ja', 'nap', 'ce',
'frr', 'pih', 'no', 'nb', 'nn',
+ 'nrm', 'nov', 'ii', 'oc', 'mrj',
'mhr', 'or', 'om', 'ng', 'hz',
+ 'uz', 'pa', 'pi', 'pag', 'pnb',
'pap', 'ps', 'km', 'pcd', 'pms',
+ 'tpi', 'nds', 'pl', 'tokipona', 'tp',
'pnt', 'pt', 'aa', 'kaa',
+ 'crh', 'ty', 'ksh', 'ro', 'rmy',
'rm', 'qu', 'ru', 'sah', 'se',
+ 'sm', 'sa', 'sg', 'sc', 'sco',
'stq', 'st', 'tn', 'sq', 'scn', 'si',
+ 'simple', 'sd', 'ss', 'sk', 'cu',
'sl', 'szl', 'so', 'ckb', 'srn',
+ 'sr', 'sh', 'su', 'fi', 'sv',
'tl', 'ta', 'kab', 'roa-tara', 'tt',
+ 'te', 'tet', 'th', 'ti', 'tg',
'to', 'chr', 'chy', 've', 'tr', 'tk',
+ 'tw', 'udm', 'bug', 'uk', 'ur',
'ug', 'za', 'vec', 'vi', 'vo',
+ 'fiu-vro', 'wa', 'zh-classical', 'vls',
'war', 'wo', 'wuu', 'ts',
+ 'yi', 'yo', 'zh-yue', 'diq', 'zea',
'bat-smg', 'zh', 'zh-tw',
+ 'zh-cn',
]
# A revised sorting order worked out on
#
http://meta.wikimedia.org/wiki/Interwiki_sorting_order
self.alphabetic_revised = [
'ace', 'af', 'ak', 'als', 'am',
'ang', 'ab', 'ar', 'an', 'arc',
- 'roa-rup', 'frp', 'as', 'ast', 'gn',
'av', 'ay', 'az', 'id', 'ms',
- 'bm', 'bn', 'zh-min-nan', 'nan',
'map-bms', 'jv', 'su', 'ba', 'be',
- 'be-x-old', 'bh', 'bcl', 'bi', 'bar',
'bo', 'bs', 'br', 'bug', 'bg',
- 'bxr', 'ca', 'ceb', 'cv', 'cs',
'ch', 'cbk-zam', 'ny', 'sn', 'tum',
- 'cho', 'co', 'cy', 'da', 'dk',
'pdc', 'de', 'dv', 'nv', 'dsb', 'na',
- 'dz', 'mh', 'et', 'el', 'eml',
'en', 'myv', 'es', 'eo', 'ext', 'eu',
- 'ee', 'fa', 'hif', 'fo', 'fr',
'fy', 'ff', 'fur', 'ga', 'gv', 'sm',
- 'gd', 'gl', 'gan', 'ki', 'glk',
'gu', 'got', 'hak', 'xal', 'ko',
- 'ha', 'haw', 'hy', 'hi', 'ho',
'hsb', 'hr', 'io', 'ig', 'ilo',
- 'bpy', 'ia', 'ie', 'iu', 'ik',
'os', 'xh', 'zu', 'is', 'it', 'he',
- 'kl', 'kn', 'kr', 'pam', 'ka',
'ks', 'csb', 'kk', 'kw', 'rw', 'ky',
- 'rn', 'sw', 'kv', 'kg', 'ht',
'ku', 'kj', 'lad', 'lbe', 'lo', 'la',
- 'lv', 'to', 'lb', 'lt', 'lij',
'li', 'ln', 'jbo', 'lg', 'lmo', 'hu',
- 'mk', 'mg', 'ml', 'krc', 'mt',
'mi', 'mr', 'arz', 'mzn', 'cdo',
- 'mwl', 'mdf', 'mo', 'mn', 'mus',
'my', 'nah', 'fj', 'nl', 'nds-nl',
- 'cr', 'ne', 'new', 'ja', 'nap',
'ce', 'frr', 'pih', 'no', 'nb',
- 'nn', 'nrm', 'nov', 'ii', 'oc',
'mhr', 'or', 'om', 'ng', 'hz', 'uz',
- 'pa', 'pi', 'pag', 'pnb', 'pap',
'ps', 'km', 'pcd', 'pms', 'nds',
- 'pl', 'pnt', 'pt', 'aa', 'kaa',
'crh', 'ty', 'ksh', 'ro', 'rmy',
- 'rm', 'qu', 'ru', 'sah', 'se',
'sa', 'sg', 'sc', 'sco', 'stq', 'st',
- 'tn', 'sq', 'scn', 'si', 'simple',
'sd', 'ss', 'sk', 'sl', 'cu',
- 'szl', 'so', 'ckb', 'srn', 'sr',
'sh', 'fi', 'sv', 'tl', 'ta',
- 'kab', 'roa-tara', 'tt', 'te', 'tet',
'th', 'vi', 'ti', 'tg', 'tpi',
- 'tokipona', 'tp', 'chr', 'chy', 've',
'tr', 'tk', 'tw', 'udm', 'uk',
- 'ur', 'ug', 'za', 'vec', 'vo',
'fiu-vro', 'wa', 'zh-classical',
- 'vls', 'war', 'wo', 'wuu', 'ts',
'yi', 'yo', 'zh-yue', 'diq', 'zea',
- 'bat-smg', 'zh', 'zh-tw', 'zh-cn',
+ 'roa-rup', 'frp', 'as', 'ast', 'gn',
'av', 'ay', 'az', 'bjn', 'id',
+ 'ms', 'bm', 'bn', 'zh-min-nan',
'nan', 'map-bms', 'jv', 'su', 'ba',
+ 'be', 'be-x-old', 'bh', 'bcl', 'bi',
'bar', 'bo', 'bs', 'br', 'bug',
+ 'bg', 'bxr', 'ca', 'ceb', 'cv',
'cs', 'ch', 'cbk-zam', 'ny', 'sn',
+ 'tum', 'cho', 'co', 'cy', 'da',
'dk', 'pdc', 'de', 'dv', 'nv',
+ 'dsb', 'na', 'dz', 'mh', 'et',
'el', 'eml', 'en', 'myv', 'es', 'eo',
+ 'ext', 'eu', 'ee', 'fa', 'hif',
'fo', 'fr', 'fy', 'ff', 'fur', 'ga',
+ 'gv', 'sm', 'gd', 'gl', 'gan',
'ki', 'glk', 'gu', 'got', 'hak',
+ 'xal', 'ko', 'ha', 'haw', 'hy',
'hi', 'ho', 'hsb', 'hr', 'io', 'ig',
+ 'ilo', 'bpy', 'ia', 'ie', 'iu',
'ik', 'os', 'xh', 'zu', 'is', 'it',
+ 'he', 'kl', 'kn', 'kr', 'pam',
'ka', 'ks', 'csb', 'kk', 'kw', 'rw',
+ 'ky', 'rn', 'mrj', 'sw', 'kv',
'kg', 'ht', 'ku', 'kj', 'lad', 'lbe',
+ 'lo', 'la', 'lv', 'to', 'lb',
'lt', 'lij', 'li', 'ln', 'jbo', 'lg',
+ 'lmo', 'hu', 'mk', 'mg', 'ml',
'krc', 'mt', 'mi', 'mr', 'arz',
+ 'mzn', 'cdo', 'mwl', 'koi', 'mdf',
'mo', 'mn', 'mus', 'my', 'nah',
+ 'fj', 'nl', 'nds-nl', 'cr', 'ne',
'new', 'ja', 'nap', 'ce', 'frr',
+ 'pih', 'no', 'nb', 'nn', 'nrm',
'nov', 'ii', 'oc', 'mhr', 'or',
+ 'om', 'ng', 'hz', 'uz', 'pa',
'pi', 'pag', 'pnb', 'pap', 'ps', 'km',
+ 'pcd', 'pms', 'nds', 'pl', 'pnt',
'pt', 'aa', 'kaa', 'crh', 'ty',
+ 'ksh', 'ro', 'rmy', 'rm', 'qu',
'ru', 'sah', 'se', 'sa', 'sg', 'sc',
+ 'sco', 'stq', 'st', 'tn', 'sq',
'scn', 'si', 'simple', 'sd', 'ss',
+ 'sk', 'sl', 'cu', 'szl', 'so',
'ckb', 'srn', 'sr', 'sh', 'fi', 'sv',
+ 'tl', 'ta', 'kab', 'roa-tara', 'tt',
'te', 'tet', 'th', 'vi', 'ti',
+ 'tg', 'tpi', 'tokipona', 'tp', 'chr',
'chy', 've', 'tr', 'tk', 'tw',
+ 'udm', 'uk', 'ur', 'ug', 'za',
'vec', 'vo', 'fiu-vro', 'wa',
+ 'zh-classical', 'vls', 'war', 'wo',
'wuu', 'ts', 'yi', 'yo',
+ 'zh-yue', 'diq', 'zea', 'bat-smg',
'zh', 'zh-tw', 'zh-cn',
]
# Order for fy: alphabetical by code, but y counts as i
@@ -110,6 +111,7 @@
'da': u'[a-zæøå]*',
'fi': u'[a-zåäö]*',
'fr': u'[a-zàâçéèêîôû]*',
+ 'frr': u'[a-zäöüßåāđē]*',
'he': u'[a-zא-ת]*',
'hu': u'[a-záéíóúöüőűÁÉÍÓÚÖÜŐŰ]*',
'it': u'[a-zàèéìòù]*',
@@ -607,7 +609,7 @@
self.language_groups = {
# languages using the arabic script (incomplete)
'arab' : [
- 'ar', 'arz', 'ps', 'sd', 'ur',
'ckb',
+ 'ar', 'arz', 'ps', 'sd', 'ur',
'bjn', 'ckb',
# languages using multiple scripts, including arabic
'kk', 'ku', 'tt', 'ug', 'pnb'
],
@@ -620,8 +622,8 @@
# languages that use the cyrillic alphabet
'cyril': [
'ab', 'av', 'ba', 'be',
'be-x-old', 'bg', 'bxr', 'ce', 'cu',
- 'cv', 'kv', 'ky', 'mk', 'lbe',
'mdf', 'mn', 'mo', 'myv', 'os',
- 'ru', 'sah', 'tg', 'tk', 'udm',
'uk', 'xal', 'mhr',
+ 'cv', 'koi', 'kv', 'ky', 'mk',
'lbe', 'mdf', 'mn', 'mo', 'myv',
+ 'mhr', 'mrj', 'os', 'ru', 'sah',
'tg', 'tk', 'udm', 'uk', 'xal',
# languages using multiple scripts, including cyrillic
'ha', 'kk', 'sh', 'sr', 'tt'
],
Modified: branches/rewrite/pywikibot/textlib.py
===================================================================
--- branches/rewrite/pywikibot/textlib.py 2010-10-17 21:05:10 UTC (rev 8661)
+++ branches/rewrite/pywikibot/textlib.py 2010-10-17 21:12:25 UTC (rev 8662)
@@ -904,7 +904,7 @@
if code in ['ne', 'new']:
return ['ne', 'new', 'hi']
#Indonesian and Malay
- if code in ['ace', 'bug', 'id', 'jv', 'ms',
'su']:
+ if code in ['ace', 'bug', 'bjn', 'id', 'jv',
'ms', 'su']:
return ['id', 'ms', 'jv']
if code == 'map-bms':
return ['jv', 'id', 'ms']
@@ -937,8 +937,9 @@
if code in ['mo', 'roa-rup']:
return ['ro']
#Russian and Belarusian
- if code in ['ab', 'av', 'ba', 'bxr', 'ce',
'cv', 'kk', 'ky', 'lbe', 'mdf',
- 'mhr', 'myv', 'os', 'sah', 'tg',
'tt', 'udm', 'uk', 'xal']:
+ if code in ['ab', 'av', 'ba', 'bxr', 'ce',
'cv', 'kk', 'koi', 'ky', 'lbe',
+ 'mdf', 'mhr', 'mrj', 'myv', 'os',
'sah', 'tg', 'tt', 'udm',
+ 'uk', 'xal']:
return ['ru']
if code in ['be', 'be-x-old']:
return ['be', 'be-x-old', 'ru']