#108702 Cannot search for Japanese keyword (at least).

#108702#5
Date:
2001-08-14 15:07:05 UTC
From:
To:
Glimpse (http://lists.debian.org/search.html) cannot search for a Japanese
keyword. It is caused by the following reason.

1) Japanese emails are usually encoded in ISO-2022-JP.
2) Common webbrowsers send Japanese letters in EUC or Shift-JIS encoding AFAIK.
3) This encoding mismatch leads to fail the search.

The encoding in which a webbrowser send a keyword is not defined or
decided, so the search system needs to first detect what encoding
is the keyword is, and then convert it into ISO-2022-JP encoding,
at least for the search for Japanese list.

I guess this encoding mismatch may happen in Chinese and Korean too, so if
listarchives is planned to provide an internationalized search system,
i'm afraid the problem becomes more difficult.

Good luck!

Thanks,

	hirot

#108702#8
Date:
2007-12-17 12:58:14 UTC
From:
To:
Hi,

a few years ago, you submitted bug 108702[1] about searching
lists.debian.org in Japanese.
We have recently switched the search engine[2] and I think that part
of the problem is solved (if only by character handling getting
better in email clients and browsers). I would much appreciate if you
could help me assess and ideally provide examples for what works and
what is still missing. In particular, I don't know whether the notion
of words the indexing uses fits well with how you would expect it to
work.

Kind regards

Thomas

1. http://bugs.debian.org/108702
2. http://lists.debian.org/search.html

#108702#15
Date:
2015-04-18 03:27:59 UTC
From:
To:
Sehr geehrter Bewerber,

die Arbeitsagentur stellt Ihnen nachfolgend eine interessante Stelle in einem internationalen Team von zu Hause aus vor, ohne Fahrtkosten, ohne Anfahrt, ohne Stau:

Wir bieten qualitative und moderne Stellen auch in ländlichen Regionen europaweit und bieten gleichzeitig hochwertige Qualität für unsere Auftraggeber.

Ab sofort sind folgenden Stellen zu besetzen:
Kollegen (m/w) für Home-office Tätigkeit im Bereich Telekommunikation und Büroarbeit

Ihre Aufgaben wären:

- Unterlagen empfangen, bearbeiten und weiterleiten
- Dokumente einscannen/kopieren
- Emails bearbeiten
- Tätigkeit im Home Office in freien Zeiteinteilung
- Umgang mit zur Verfügung gestellten Systemen

Anforderungen an Sie:

- Problemloser Umgang mit E-mail, PC und Internet
- Deutsch fließend, Fremdsprachen wären vorteilhaft
- zuverlässiges Teamwork
- Genauigkeit und Zielstrebigkeit

Wir bieten Ihnen einen Arbeitsplatz in Festanstellung oder als Selbständige mit einem Stundenlohn von 20 € Brutto pro Stunde in eigenverantwortlichen Arbeitsweise und einer modernen Beschäftigungsform, sowie eine abwechslungsreiche Tätigkeit ohne Fahrzeit mit flexiblen Arbeitszeiten.

Es werden keine Fachkenntnisse vorausgesetzt. Die Einarbeitung findet schrittweise durch professionelle Mitarbeiten statt. Die nötige technische Ausrüstung stellen wir Ihnen kostenlos zur Verfügung. Die Arbeit kann gerne nebenberuflich aufgenommen werden sowie von Rentnern und Hausfrauen.

Sie sind bereit für flexible Arbeitszeitmodelle und die Arbeit im Home Office? Wenn wir Ihr Interesse geweckt haben, senden Sie uns Ihre Bewerbung per E-Mail an: VIRINAD1093@qualityservice.com


Wir freuen uns auf Ihre Bewerbung.

Mit freundlichen Grüßen

Frank SC

#108702#20
Date:
2015-08-13 10:14:52 UTC
From:
To:
Control: tags -1 +confirmed

Everything should be getting normalised to UTF-8 now, so differences
in encodings used shouldn't be an issue.

The notion of what is a word is an issue still, as the tokenisation
currently assumes words are separated by whitespace.

So you can get some search results, but only where the word stands
alone:

https://lists.debian.org/cgi-bin/search?P=%E7%99%BA%E9%9F%B3

Cheers,
    Olly

#108702#25
Date:
2015-08-13 10:14:52 UTC
From:
To:
Control: tags -1 +confirmed

Everything should be getting normalised to UTF-8 now, so differences
in encodings used shouldn't be an issue.

The notion of what is a word is an issue still, as the tokenisation
currently assumes words are separated by whitespace.

So you can get some search results, but only where the word stands
alone:

https://lists.debian.org/cgi-bin/search?P=%E7%99%BA%E9%9F%B3

Cheers,
    Olly

#108702#30
Date:
2025-02-08 04:50:26 UTC
From:
To:
Final Notice.

You are among the beneficiaries of 2024/2025 grant for all scam victims and relatives reconfirm your email if active for more details

Thank You.

Regards
Mr. Rowland Cole
( Financial Crimes Enforcement Network)

#108702#33
Date:
2025-02-08 04:49:20 UTC
From:
To:
Final Notice.

You are among the beneficiaries of 2024/2025 grant for all scam victims and relatives reconfirm your email if active for more details

Thank You.

Regards
Mr. Rowland Cole
( Financial Crimes Enforcement Network)

#108702#38
Date:
2025-02-08 04:49:12 UTC
From:
To:
Final Notice.

You are among the beneficiaries of 2024/2025 grant for all scam victims and relatives reconfirm your email if active for more details

Thank You.

Regards
Mr. Rowland Cole
( Financial Crimes Enforcement Network)