import java.io.UnsupportedEncodingException;
import java.net.URLEncoder;
public class UnicodeChange {
//UTF-8->GB2312
public static String utf8Togb2312(String str){
StringBuffer sb = new StringBuffer();
for ( int i=0; i<str.length(); i++) {
char c = str.charAt(i);
switch (c) {
case '+' :
sb.append( ' ' );
break ;
case '%' :
try {
sb.append(( char )Integer.parseInt (
str.substring(i+1,i+3),16));
}
catch (NumberFormatException e) {
throw new IllegalArgumentException();
}
i += 2;
break ;
default :
sb.append(c);
break ;
}
}
String result = sb.toString();
String res= null ;
try {
byte [] inputBytes = result.getBytes( "8859_1" );
res= new String(inputBytes, "UTF-8" );
}
catch (Exception e){}
return res;
}
//GB2312->UTF-8
public static String gb2312ToUtf8(String str) {
String urlEncode = "" ;
try {
urlEncode = URLEncoder.encode (str, "UTF-8" );
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
return urlEncode;
}
public static void main(String[] args){
try {
String str="輸入簡體字,點下面繁體字按鈕進行在線轉換.";//%E4%B8%AD%E5%9B%BD
str=gb2312ToUtf8(str);
System.out.println(str);
str=utf8Togb2312(str);
System.out.println(str);
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
分享到:
相关推荐
能够集成到Source Insight中,解决JAVA文件乱码问题
不幸的是,广收欢迎的代码查看工具Source insight 虽然支持汉字,但是它不支持UTF-8。笔者感到疑惑的是,当初开发source insight的这帮人现在哪里去了?为何不继续开发?这么好的工具,却不再更新了,实在让人可惜。...
修改xml文件的编码格式:GB2312格式修改为UTF-8
字符转码,gb2312 usc2 ,utf-8 随意转换
身份证读卡器生成的基本信息TEXT文件,由于是采用 GB 13000 的 UCS-2 编码格式,java读取出来是乱码,这个段代码就是解决转码问题的,亲测可用
想到如下特征来识别汉字: 1. 如果第1位是0就不需要判断的,一定是ASCII字符。... 如果第1位是1开头的,第2位是0开头的,一定是GB编码。 3. 如果第1位是非1110开头的,则一定是GB编码。 4. 多做几个汉字判断。
URL编码,Gb2312页面提交到Utf-8页面
软件支持UTF-8,GB,BIG5文件类型之间的转换. 大家可以试试,很不错的东东.呵呵~~
java爬虫-可自定义webUrl编码 原jsoup中webUrl编码格式为固定UTF-8 例如新浪网编码为GB2312 Connection conn = Jsoup.connect(url); conn.request().webEncode("GB2312");即可设置好webUrl编码格式
通过Java实现文件编码的转换功能,提供了Demo用于测试。 目前仅测试了GB2312 UTF-8之间的相互转换,ISO-8859-1不支持。其余的没有测试
java 取文件的编码格式 例如UTF-8,GBK,UTF-16,GB2312等等 java 取文件的编码格式 例如UTF-8,GBK,UTF-16,GB2312等等 java 取文件的编码格式 例如UTF-8,GBK,UTF-16,GB2312等等
java 识别文件的编码格式 读取文件的编码 utf-8 gbk gb2312 java 编码 java 获取文件编码格式 java 乱码查找
总是遇到文件编码不一致的情况,自己抽...支持gb2312、gbk(ansi)、gb18030、utf-8、utf-8bom、utf-16le、utf-16be 自动识别文本文件后缀名、原始编码格式,根据用户设定的目标编码智能转换 其他详细说明见软件内说明。
byte UTF-8 sequence原因分析在中文版的window下java的默认的编码为GBK,也就是所虽然我们标识了要将xml保存为utf-8格式但实际上文件是以GBK格式来保存的,所以这也就是为什么能够我们使用GBK、GB2312编码来生成xml...
程序可以打开不同编码类型的txt文档。解决显示乱码情况 gb2312 big5 shift-jis kr thai utf8 utf16 使用方法 命令行cmd chartype /? 查看帮助
GBK/2为与GB2312兼容的国标汉字部分,GBK/3和GBK/4为扩展汉字部分 每一部分都有自己的地址计算公式 若输入是acsii则返回同样的acsii 若输入是中文字符则返回拼音的首字母 若输入是中文字符但是该字符不知道如何...
1.修改Web容器的字符编码,如果Web容器用的是Tomcat,则修改conf/server.xml文件,在两个Connector中添加“URIEncoding="utf-8"”,我这里用的是utf-8编码,所以修改成utf-8,若项目是gb2312编码,则设置为...
java工具jar文件 获取文件的编码格式 例如UTF-8,GBK,UTF-16,GB2312等等
档案转换只能将纯文字格式的文件(例如 txt, html 等)转码,并不适用于如 MS Word, Excel 等 binary 档案。
java文件编码识别代码,有效识别常见的编码内容,欢迎补充