US-ASCII is a subset of UTF-8 so can be handled directly when UTF-8 is
[mmh] / sbr / check_charset.c
index 5d98774..f45448d 100644 (file)
@@ -32,8 +32,9 @@ check_charset (char *str, int len)
            mm_charset = "US-ASCII";
        mm_len = strlen (mm_charset);
 
-       /* US-ASCII is a subset of the ISO-8859-X character sets */
-       if (!strncasecmp("ISO-8859-", mm_charset, 9)) {
+       /* US-ASCII is a subset of the ISO-8859-X and UTF-8 character sets */
+       if (!strncasecmp("ISO-8859-", mm_charset, 9) ||
+               !strcasecmp("UTF-8", mm_charset)) {
            alt_charset = "US-ASCII";
            alt_len = strlen (alt_charset);
        }