Java 没有内置的字符串类型,而是在标准 Java 类库中提供了一个预定义类,很自然地叫做 String。每个用双引号括起来的字符串都是 String 类的一个实例。
String emp = "";
String demo = "demo";
构建字符串
有些时候,需要由较短的字符串构建字符串,例如,按键或来自文件中的单词。采用字符串连接的方式达到此目的效率比较低。每次连接字符串,都会构建一个新的 String 对象,既耗时,又浪费空间。使用 StringBuilder 类就可以避免这个问题的发生。
如果需要用许多小段的字符串构建一个字符串,new StringBuilder 之后,当每次需要添加一部分内容时,就调用 append 方法。
StringBuilder stringBuilder = new StringBuilder();
stringBuilder.append("knowledge");
stringBuilder.append("dict");
System.out.println(stringBuilder.toString());
在需要构建字符串时就调用 toString 方法,将可以得到一个 String 对象,其中包含了构建器中的字符序列。
注释:在 JDK 5.0 中引入 StringBuilder 类。这个类的前身是 StringBuffer,其效率稍有些低,但允许采用多线程的方式执行添加或删除字符的操作。如果所有字符串在一个单线程中编辑(通常都是这样),则应该用 StringBuilder 替代它。这两个类的 API 是相同的。
子串
String 类的 substring 方法可以从一个较大的字符串提取出一个子串。
String demo = "KnowledgeDict";
String s = demo.substring(0, 9);
System.out.println(s);
输出:
Knowledge
拼接
与绝大多数的程序设计语言一样,Java 语言允许使用 +
号连接(拼接)两个字符串。
String a = "Knowledge";
String b = "Dict";
String c = a + b;
当将一个字符串与一个非字符串的值进行拼接时,后者被转换成字符串(任何一个 Java 对象都可以转换成字符串)。
String t = "tool";
int n = 188;
String tn = t + n;
如果需要把多个字符串放在一起,用一个定界符分隔,可以使用静态 join 方法:
String knowledgeDict = String.join("_", "knowledge", "dict");
System.out.println(knowledgeDict);
输出结果为:
knowledge_dict
不可变字符串
String 类没有提供用于修改字符串的方法。由于不能修改 Java 字符串中的字符,所以在 Java 文档中将 String 类对象称为不可变字符串。
当然,可以修改字符串变量,让它引用另外一个字符串。
不可变字符串有一个优点:编译器可以让字符串共享。可以想象将各种字符串存放在公共的存储池中。字符串变量指向存储池中相应的位置。如果复制一个字符串变量,原始字符串与复制的字符串共享相同的字符。
总而言之,Java 的设计者认为共享带来的高效率远远胜过于提取、拼接字符串所带来的低效率。查看一下程序会发现:很少需要修改字符串,而是往往需要对字符串进行比较。
检测字符串是否相等
可以使用 equals 方法检测两个字符串是否相等。
要想检测两个字符串是否相等,而不区分大小写,可以使用 equalsIgnoreCase 方法。
String know = "knowledge";
System.out.println(know.equals("knowledge"));
System.out.println(know.equalsIgnoreCase("Knowledge"));
一定不要使用 ==
运算符检测两个字符串是否相等。这个运算符只能够确定两个字符串是否放置在同一个位置上。当然,如果字符串放置在同一个位置上,它们必然相等。但是,完全有可能将内容相同的多个字符串的拷贝放置在不同的位置上。
如果虚拟机始终将相同的字符串共享,就可以使用 ==
运算符检测是否相等。但实际上只有字符串常量是共享的,而 +
或 substring 等操作产生的结果并不是共享的。因此,千万不要使用 ==
运算符测试字符串的相等性,以免在程序中出现糟糕的 bug。从表面上看,这种 bug 很像随机产生的间歇性错误。
空串与 null 串
空串 ""
是长度为 0 的字符串。
可以调用以下代码检查一个字符串是否为空:
String str = "";
if (str.length() == 0) {
// to do
}
if (str.equals("")) {
// to do
}
空串是一个 Java 对象,有自己的串长度(0)和内容(空)。不过,String 变量还可以存放一个特殊的值,名为 null,这表示目前没有任何对象与该变量关联。
要检查一个字符串是否为 null,要使用以下条件:
有时要检查一个字符串既不是 null 也不为空串,这种情况下就需要使用以下条件:
String str = "";
if (str != null && str.length() != 0) {
// to do
}
首先要检查 str 不为 null,如果在一个 null 值上调用方法会出现错误(NPE,空指针错误)。
String API
Java 中的 String 类包含了 50 多个方法。令人惊讶的是绝大多数都很有用,可以设想使用的频繁非常高。
下面列出了一部分最常用的方法。
版本 | 方法描述 |
---|---|
1.0 | char charAt(int index) 返回给定位置的代码单元。除非对底层的代码单元感兴趣,否则不需要调用这个方法。 |
1.5 | int codePointAt(int index) 返回从给定位置开始的码点。 |
1.0 | int compareTo(String anotherString) 按照字典顺序,如果字符串位于 anotherString 之前,返回一个负数;如果字符串位于 anotherString 之后,返回一个正数;如果两个字符串相等,返回 0。 |
1.2 | int compareToIgnoreCase(String str) 按字典顺序比较两个字符串,不考虑大小写。 |
1.0 | String concat(String str) 将指定字符串连接到此字符串的结尾。 |
1.4 | boolean contentEquals(StringBuffer sb) 当且仅当字符串与指定的 StringBuffer 有相同顺序的字符时候返回真。 |
1.0 | static String copyValueOf(char[] data) 返回指定数组中表示该字符序列的 String。 |
1.0 | static String copyValueOf(char[] data, int offset, int count) 返回指定数组中表示该字符序列的 String。 |
1.0 | boolean endsWith(String suffix) 测试此字符串是否以指定的后缀结束。 |
1.0 | boolean equals(Object anObject) 如果字符串与 anObject 相等,返回 true。 |
1.0 | boolean equalsIgnoreCase(String anotherString) 如果字符串与 anotherString 相等(忽略大小写),返回 true。 |
1.1 | byte[] getBytes() 使用平台的默认字符集将此 String 编码为 byte 序列,并将结果存储到一个新的 byte 数组中。 |
1.6 | byte[] getBytes(String charsetName) 使用指定的字符集将此 String 编码为 byte 序列,并将结果存储到一个新的 byte 数组中。 |
1.0 | void getChars(int srcBegin, int srcEnd, char[] dst, int dstBegin) 将字符从此字符串复制到目标字符数组。 |
1.0 | int hashCode() 返回此字符串的哈希码。 |
1.0 | int indexOf(int ch) 返回指定字符在此字符串中第一次出现处的索引。 |
1.0 | int indexOf(int ch, int fromIndex) 返回在此字符串中第一次出现指定字符处的索引,从指定的索引开始搜索。 |
1.0 | int indexOf(String str) 返回指定子字符串在此字符串中第一次出现处的索引。 |
1.0 | int indexOf(String str, int fromIndex) 返回指定子字符串在此字符串中第一次出现处的索引,从指定的索引开始。 |
1.0 | String intern() 返回字符串对象的规范化表示形式。 |
1.8 | static String join(CharSequence delimiter, CharSequence... elements) 返回一个新字符串,用给定的定界符连接所有元素。 |
1.0 | int lastIndexOf(int ch) 返回指定字符在此字符串中最后一次出现处的索引。 |
1.0 | int lastIndexOf(int ch, int fromIndex) 返回指定字符在此字符串中最后一次出现处的索引,从指定的索引处开始进行反向搜索。 |
1.0 | int lastIndexOf(String str) 返回指定子字符串在此字符串中最右边出现处的索引。 |
1.0 | int lastIndexOf(String str, int fromIndex) 返回指定子字符串在此字符串中最后一次出现处的索引,从指定的索引开始反向搜索。 |
1.0 | int length() 返回此字符串的长度。 |
1.4 | boolean matches(String regex) 返回此字符串是否匹配给定的正则表达式。 |
1.0 | boolean regionMatches(boolean ignoreCase, int toffset, String other, int ooffset, int len) 测试两个字符串区域是否相等。 |
1.0 | boolean regionMatches(int toffset, String other, int ooffset, int len) 测试两个字符串区域是否相等。 |
1.0 | String replace(char oldChar, char newChar) 返回一个新的字符串,它是通过用 newChar 替换此字符串中出现的所有 oldChar 得到的。 |
1.4 | String replaceAll(String regex, String replacement) 使用给定的 replacement 替换此字符串所有匹配给定的正则表达式的子字符串。 |
1.4 | String replaceFirst(String regex, String replacement) 使用给定的 replacement 替换此字符串匹配给定的正则表达式的第一个子字符串。 |
1.4 | String[] split(String regex) 根据给定正则表达式的匹配拆分此字符串。 |
1.4 | String[] split(String regex, int limit) 根据匹配给定的正则表达式来拆分此字符串。 |
1.0 | boolean startsWith(String prefix) 测试此字符串是否以指定的前缀开始。 |
1.0 | boolean startsWith(String prefix, int toffset) 测试此字符串从指定索引开始的子字符串是否以指定前缀开始。 |
1.4 | CharSequence subSequence(int beginIndex, int endIndex) 返回一个新的字符序列,它是此序列的一个子序列。 |
1.0 | String substring(int beginIndex) 返回一个新的字符串,它是此字符串的一个子字符串。 |
1.0 | String substring(int beginIndex, int endIndex) 返回一个新字符串,它是此字符串的一个子字符串。 |
1.0 | char[] toCharArray() 将此字符串转换为一个新的字符数组。 |
1.0 | String toLowerCase() 使用默认语言环境的规则将此 String 中的所有字符都转换为小写。 |
1.1 | String toLowerCase(Locale locale) 使用给定 Locale 的规则将此 String 中的所有字符都转换为小写。 |
1.0 | String toString() 返回此对象本身。 |
1.0 | String toUpperCase() 使用默认语言环境的规则将此 String 中的所有字符都转换为大写。 |
1.1 | String toUpperCase(Locale locale) 使用给定 Locale 的规则将此 String 中的所有字符都转换为大写。 |
1.0 | String trim() 返回字符串的副本,忽略前导空白和尾部空白。 |
1.0 | static String valueOf(primitive data type x) 返回给定基本类型 x 参数的字符串表示形式。 |