Strasznie dużo czasu zmarnowałem usiłując zmienić kodowanie w bazie MySQL na UTF i dopasować skrypty Perla do tej zmiany.
Przestawienie MySQLa na UTF-8 jest proste:
mysql -u www -p --default-character-set=utf8 CREATE database kpma CHARACTER SET utf8 COLLATE utf8_bin;
Baza kpma
(użytkownika www
) będzie
kodowana w UTF-8. Można też określić domyślne kodowanie
wszystkich baz
w pliku konfiguracji MySQLa, tj. w pliku /etc/mysql/my.cnf
(Debian):
[mysqld] ... default-character-set = utf8
Trochę diagnostyki:
use kpma; show variables like 'char%'; show table status; select tytul from Utwor; ## jest OK -- na konsoli widać poprawne różne znaki diakrytyczne
Prawdziwa męka to było zmuszenie Perla do poprawnego traktowania danych UTF.
Trzy kluczowe dla poprawnego przetwarzania UTF sprawy to:
1) klauzula binmod
(patrz poniżej);
2) klauzula use utf8
(jeżeli skrypt zawiera napisy kodowane w UTF);
3) wpisy mysql_enable_utf8
/SET NAMES utf8
dotyczące MySQLa.
Szkielet skryptu Perla wygląda następująco:
#!/usr/bin/perl -w # -*- coding: utf-8 -*- -- # use strict; use utf8; ## skrypt zawiera napisy kodowane UTF use CGI qw(:standard); use DBI; binmode(STDOUT, ":utf8"); ## bez tego problemy z UTF my $dbname = 'kpma'; ## Nazwa bazy my $dbuser = 'www'; ## Nazwa użytkownika MySQL my $dbpasswd = '??????'; ## Hasło dla $dbuser my $dsn = "dbi:mysql:$dbname:localhost:3306"; my $dbh = DBI->connect($dsn, "$dbuser", "$dbpasswd", { ChopBlanks => 1 }); $dbh->{'mysql_enable_utf8'} = 1; $dbh->do('SET NAMES utf8'); my $SQL = "SELECT tytul FROM Utwor WHERE id_kompozytor1 = 59 ORDER BY rok "; ##my $SQL = "SELECT nazwisko FROM Kompozytor "; my $sth = $dbh->prepare($SQL); $sth ->execute(); while ( my @piece = $sth->fetchrow_array() ) { print ">> @piece\n"; } $dbh->disconnect || warn "Nie mogę zamknąć bazy $dbname\n";
Jeżeli skrypt korzysta (pobiera dane)
z param()
to koniecznie należy
zastosować funkcję decode_utf8
:
use Encode; ## param() trzeba dekodować if (param()) {# -- Wypełniono formularz -- ## http://ahinea.com/en/tech/perl-unicode-struggle.html my $who = Encode::decode_utf8(param("kto"));
Działa nawet z dość starym Perlem:
$perl --version This is perl, v5.10.0 built for arm-linux-gnueabi-thread-multi Copyright 1987-2007, Larry Wall
Fragment koncertu w kościele pw. św. Andrzeja Boboli w Sopocie (11 lipca 2011).
Dziś o 23.05 w radiu Gdańsk będzie o płycie Elki i Anki S pn. Duo Sopot. Na tę okoliczność gorączkowo ustaliłem jak słuchać Radia Gdańsk przez Internet. Klikanie w przeglądarce oczywiście nie działa, bo formaty są dedykowane na system alternatywny (konkretnie są w formacie aacPlus). Należy wpisać w konsoli:
xine -H http://www.radio.gdansk.pl/audio/rg.pls
Więcej nt. radia internetowego -- także w linuksie -- na stronie radioapma.elzet.biz/jaksluchac.html. Można też kliknąć w rysunek obok, aby dowiedzieć się więcej o płycie Duo Sopot.
Dopisane 1 kwietnia 2008: Dziś usiłowałem słuchać transmisji meczu Man Utd vs AS Roma w radiu iGol FM:
xine -H http://fm.igol.pl/igol.m3u
Działa tak sobie. Są kłopoty ze startem -- pomoga kilkukrotne uruchomienie + nerwowe kliki w okno xmms. Transmisja jest przerywana (buforowanie). Nie wiem czemu.
Dopisane 19 kwietnia 2009: Polskie radio
można też słuchać używając vlc
:
vlc http://www.polskieradio.pl/st/program1M.asx
xine
nie działa, bo coś-tam, albo nie potrafię go uruchomić
we właściwy sposób