Backport #6206
closedencoding of empty string from String#split
String#split が空文字列を返す場合に、エンコーディングが ASCII-8BIT になる時がありますが、
a = "a:".split(":", 2) # => ["a", ""] # => [#Encoding:UTF-8, #Encoding:ASCII-8BIT]
関係あるかどうか分かりませんが、partition だと以下のようになります。
a = "a:".partition(":") # => ["a", ":", ""] # => [#Encoding:UTF-8, #Encoding:UTF-8, #Encoding:UTF-8]
が、パターンが含まれていない場合は ASCII-8BIT になります。
a = "a:".partition("|") # => ["a:", "", ""] # => [#Encoding:UTF-8, #Encoding:ASCII-8BIT, #Encoding:ASCII-8BIT]
SQLite3 が ASCII-8BIT の文字列を text なカラムに追加するときに、
勝手に blob になってしまって検索出来なくなるという問題を見かけました。
Updated by no6v (Nobuhiro IMAI) almost 13 years ago
"" が ASCII-8BIT になるのが問題というよりは、処理の途中で出来た ASCII-8BIT な
"" に対して何か + したり << したりして結果として ASCII-8BIT な文字列が出来てしまうのが
Updated by nobu (Nobuyoshi Nakada) almost 13 years ago
This issue was solved with changeset r35146.
Nobuhiro, thank you for reporting this issue.
Your contribution to Ruby is greatly appreciated.
May Ruby be with you.
- string.c (str_new_empty): should copy also the encoding as an
empty substring. [ruby-dev:45441][Bug #6206]
Updated by no6v (Nobuhiro IMAI) almost 13 years ago
r35146 の 1.9.3 へのバックポートを希望します。
$ ruby -ve 'p "a:".split(":", 2).map(&:encoding)'
ruby 1.9.3p168 (2012-03-29 revision 35166) [x86_64-linux]
[#Encoding:UTF-8, #Encoding:ASCII-8BIT]
Updated by naruse (Yui NARUSE) almost 13 years ago
Updated by naruse (Yui NARUSE) almost 13 years ago
This issue was solved with changeset r35178.
merge revision(s) 35146:
* string.c (str_new_empty): should copy also the encoding as an
empty substring. [ruby-dev:45441][Bug #6206]