Многие отечественные сайты предпочитают отдавать ответы именно в этой кодировке. Нативной поддержки в Windows Phone 7 1251 страницы нет. Приходится изворачиваться.

Без этой страницы нет никакой возможности декодировать подстановки вида &x<код_символа>;. Поэтому без нее – как без рук.

Реализация предельно простая и не требует для своего понимания никаких телодвижений. Кодовая страница 1251 – это обычная однобайтовая кодировка, каждому байту соответствует конкретный символ. Таблицу перевода можно найти, например, в Википедии – она тайны не представляет. Для перевода байт в символ мы воспользуемся обычным массивом, где коду каждого символа сопоставлено его значение, находящийся в массиве по индексу, равному коду, а для обратного перевода – хеш-таблицей, где ключи будут представлять собой символы, а значения – их коды в 1251 странице.

Также, внутри вы найдете функцию для перевода кода в символ в заданной кодовой странице. Удивительно, но такой простой вещи в .NET не существует.

Существует такое решение. Его главный недостаток – это низкая скорость перевода из символов в байты, потому что фактически по каждому символу выполняется полный проход по строке. Хотя, конечно, он гораздо проще в реализации. Ну и юникодные символы в листинге – это все-таки не совсем фен-шуй.

  public class CP1251Encoding : Encoding
  {
    public static Encoding CP1251 { get; private set; }

    private static int[] _rawCharmap = new int[]     {
      0x0000, 0x0001, 0x0002, 0x0003, 0x0004, 0x0005, 0x0006, 0x0007, 0x0008, 0x0009, 0x000a, 0x000b, 0x000c, 0x000d, 0x000e, 0x000f,
      0x0010, 0x0011, 0x0012, 0x0013, 0x0014, 0x0015, 0x0016, 0x0017, 0x0018, 0x0019, 0x001a, 0x001b, 0x001c, 0x001d, 0x001e, 0x001f,
      0x0020, 0x0021, 0x0022, 0x0023, 0x0024, 0x0025, 0x0026, 0x0027, 0x0028, 0x0029, 0x002a, 0x002b, 0x002c, 0x002d, 0x002e, 0x002f,
      0x0030, 0x0031, 0x0032, 0x0033, 0x0034, 0x0035, 0x0036, 0x0037, 0x0038, 0x0039, 0x003a, 0x003b, 0x003c, 0x003d, 0x003e, 0x003f,
      0x0040, 0x0041, 0x0042, 0x0043, 0x0044, 0x0045, 0x0046, 0x0047, 0x0048, 0x0049, 0x004a, 0x004b, 0x004c, 0x004d, 0x004e, 0x004f,
      0x0050, 0x0051, 0x0052, 0x0053, 0x0054, 0x0055, 0x0056, 0x0057, 0x0058, 0x0059, 0x005a, 0x005b, 0x005c, 0x005d, 0x005e, 0x005f,
      0x0060, 0x0061, 0x0062, 0x0063, 0x0064, 0x0065, 0x0066, 0x0067, 0x0068, 0x0069, 0x006a, 0x006b, 0x006c, 0x006d, 0x006e, 0x006f,
      0x0070, 0x0071, 0x0072, 0x0073, 0x0074, 0x0075, 0x0076, 0x0077, 0x0078, 0x0079, 0x007a, 0x007b, 0x007c, 0x007d, 0x007e, 0x007f,
      0x0402, 0x0403, 0x201a, 0x0453, 0x201e, 0x2026, 0x2020, 0x2021, 0x20ac, 0x2030, 0x0409, 0x2039, 0x040a, 0x040c, 0x040b, 0x040f,
      0x0452, 0x2018, 0x2019, 0x201c, 0x201d, 0x2022, 0x2013, 0x2014, 0xffff, 0x2122, 0x0459, 0x203a, 0x045a, 0x045c, 0x045b, 0x045f,
      0x00a0, 0x040e, 0x045e, 0x0408, 0x00a4, 0x0490, 0x00a6, 0x00a7, 0x0401, 0x00a9, 0x0404, 0x00ab, 0x00ac, 0x00ad, 0x00ae, 0x0407,
      0x00b0, 0x00b1, 0x0406, 0x0456, 0x0491, 0x00b5, 0x00b6, 0x00b7, 0x0451, 0x2114, 0x0454, 0x00bb, 0x0458, 0x0405, 0x0455, 0x0457,
      0x0410, 0x0411, 0x0412, 0x0413, 0x0414, 0x0415, 0x0416, 0x0417, 0x0418, 0x0419, 0x041a, 0x041b, 0x041c, 0x041d, 0x041e, 0x041f,
      0x0420, 0x0421, 0x0422, 0x0423, 0x0424, 0x0425, 0x0426, 0x0427, 0x0428, 0x0429, 0x042a, 0x042b, 0x042c, 0x042d, 0x042e, 0x042f,
      0x0430, 0x0431, 0x0432, 0x0433, 0x0434, 0x0435, 0x0436, 0x0437, 0x0438, 0x0439, 0x043a, 0x043b, 0x043c, 0x043d, 0x043e, 0x043f,
      0x0440, 0x0441, 0x0442, 0x0443, 0x0444, 0x0445, 0x0446, 0x0447, 0x0448, 0x0449, 0x044a, 0x044b, 0x044c, 0x044d, 0x044e, 0x044f,
    };

    private static readonly char[] _charmap;
    private static Dictionary<char, byte> _reverseCharmap;

    static CP1251Encoding()
    {
      _charmap = new char[_rawCharmap.Length];
      for (int i = 0; i < _charmap.Length; i++)
        _charmap[i] = (char)_rawCharmap[i];
      _rawCharmap = null;

      _reverseCharmap = new Dictionary<char, byte>(_charmap.Length);
      for (int i = 0; i < _charmap.Length; i++)
        _reverseCharmap.Add(_charmap[i], (byte)i);

      CP1251 = new CP1251Encoding();
    }

    public override int GetByteCount(char[] chars, int index, int count)
    {
      return count;
    }

    public override int GetBytes(char[] chars, int charIndex, int charCount, byte[] bytes, int byteIndex)
    {
      int deltaCharByteIndex = byteIndex - charIndex;

      for (int i = charIndex; i < charIndex + charCount; i++)
        bytes[i - deltaCharByteIndex] = _reverseCharmap[chars[i]];

      return charCount;
    }

    public override int GetCharCount(byte[] bytes, int index, int count)
    {
      return count;
    }

    public override int GetChars(byte[] bytes, int byteIndex, int byteCount, char[] chars, int charIndex)
    {
      int deltaCharByteIndex = charIndex - byteIndex;

      for (int i = byteIndex; i < byteIndex + byteCount; i++)
        chars[i - deltaCharByteIndex] = _charmap[bytes[i]];

      return byteCount;
    }

    public override int GetMaxByteCount(int charCount)
    {
      return charCount;
    }

    public override int GetMaxCharCount(int byteCount)
    {
      return byteCount;
    }

    public override string WebName { get { return "Windows-1251"; } }
  }

* This source code was highlighted with Source Code Highlighter.

  public static class EncodingExt
  {
    public static char Chr(this Encoding encoding, int charCode)
    {
      if (charCode < 0)
        throw new ArgumentException("Char code can't be less than zero");

      int bytesCount = (int)Math.Ceiling(Math.Log(charCode, 256));
      return encoding.GetChars(TakeNBytes(BitConverter.GetBytes(charCode), bytesCount))[0];
    }

    private static byte[] TakeNBytes(byte[] array, int count)
    {
      byte[] result = new byte[count];

      if (BitConverter.IsLittleEndian)
        for (count -= 1; count >= 0; count--)
          result[count] = array[count];
      else
        for (int i = 0; i < count; i++)
          result[result.Length - i] = array[array.Length - i];

      return result;
    }
  }

* This source code was highlighted with Source Code Highlighter.

Share →

2 Responses to Windows Phone 7 Dev – кодовая страница 1251

  1. logonoff says:

    Спасибо за улучшение метода из моего поста) учел в своих разработках

  2. Алексей says:

    Спасибо огромное. Спасли мое время и мозг. )))

Leave a Reply

Войти с помощью: 

Your email address will not be published. Required fields are marked *

PageLines