Java 字符串分割截取的方法 (substring,split,StringTokenizer,indexOf,lastIndexOf)

需求,把”01:大汽车”,分成01和大汽车

有两种做法:一是substring

package test;

public class substringTest
{
 public static void main(String args[]) 
 { 
  String N = "01:大汽车"; 
  String L=""; 
  String R=""; 
  int k= N.length(); 
  for (int i = 0; i < N.length(); i++) 
  { 
   if (N.substring(i, i + 1).equals("|")) 
   {   
    L=N.substring(0,i).trim(); 
    R=N.substring(i+1,k).trim(); 
   } 
   else 
   { 
              
   } 
   System.out.println(L); 
   System.out.println(R); 
  }
 }
} 

另外一种方法

package Test

public class splitTest
{
    public static void main(String[] args)
    {
        String s = new String("01:大汽车"); 
        String a[] = s.split(":");
    
        System.out.println(a[0]);
        System.out.println(a[1]);
    }
}

split分割字母和数字,简单正则缝隙

public class Test01 {
    public static void main(String[] args) {
        String str = "one123";
        String regex = "(?<=one)(?=123)";
        String[] strs = str.split(regex);
        for(int i = 0; i < strs.length; i++) {
            System.out.printf("strs[%d] = %s%n", i, strs[i]);
        }
    }
}

1. substring讲解:

s=s.substring(int begin);截取掉s从首字母起长度为begin的字符串,将剩余字符串赋值给s;

s=s.substring(int begin,int end);截取s中从begin开始至end结束时的字符串,并将其赋值给s;

在String中有两个substring()函数,如下:

一:String.substring(int start)

参数:

start:要截取位置的索引

返回:

从start开始到结束的字符串

例如:String str = “hello word!”;         System.out.println(str.substring(1));

System.out.println(str.substring(3));

System.out.println(str.substring(6));

将得到结果为:

ello word!

lo word!

ord!

如果start大于字符串的长度将会抛出越界异常;

二:String.substring(int beginIndex, int endIndex)

参数:

beginIndex 开始位置索引

endIndex    结束位置索引

返回:

从beginIndex位置到endIndex位置内的字符串

例如:String str = “hello word!”;

System.out.println(str.substring(1,4));

System.out.println(str.substring(3,5));

System.out.println(str.substring(0,4));

将得到结果为:

ell

lo

hell

如果startIndex和endIndex其中有越界的将会抛出越界异常。

2. split讲解:

java.lang.string.split
split 方法
将一个字符串分割为子字符串,然后将结果作为字符串数组返回。
stringObj.split([separator,[limit]])
参数
stringObj
必选项。要被分解的 String 对象或文字。该对象不会被 split 方法修改。
separator
可选项。字符串或 正则表达式 对象,它标识了分隔字符串时使用的是一个还是多个字符。如果忽略该选项,返回包含整个字符串的单一元素数组。
limit
可选项。该值用来限制返回数组中的元素个数。

说明
split 方法的结果是一个字符串数组,在 stingObj 中每个出现 separator 的位置都要进行分解。separator 不作为任何数组元素的部分返回。

split 的实现直接调用的 matcher 类的 split 的方法。“ . ”在正则表达式中有特殊的含义,因此我们使用的时候必须进行转义。

package com.c2;
 
//写一个spli的用法,数字类 ===分割字符串 
public class yqw {
    public static void main(String[] args) {
        String a = "192.168.43.130";
        String c[] = a.split("\\.");// 数组
        for (int i = 0; i < c.length; i++) {
            System.out.println(c[i]);
        }
 
    }
}
//
192
168
43
130

在java.lang包中有String.split()方法,返回是一个数组。


  1、“.”和“|”都是转义字符,必须得加”\\”;
  如果用“.”作为分隔的话,必须是如下写法:
String.split(“\\.”),这样才能正确的分隔开,不能用String.split(“.”);
如果用“|”作为分隔的话,必须是如下写法:
String.split(“\\|”),这样才能正确的分隔开,不能用String.split(“|”);

2、如果在一个字符串中有多个分隔符,可以用“|”作为连字符,比如:“acount=? and uu =? or n=?”,把三个都分隔出来,可以用
String.split(“and|or”);

3、public String[] split(String regex,int limit)根据匹配给定的正则表达式来拆分此字符串。
此方法返回的数组包含此字符串的每个子字符串,这些子字符串由另一个匹配给定的表达式的子字符串终止或由字符串结束来终止。数组中
的子字符串按它们在此字符串中的顺序排列。如果表达式不匹配输入的任何部分,则结果数组只具有一个元素,即此字符串。

4、public string[] split(string regex)
这里的参数的名称是 regex ,也就是 regular expression (正则表达式)。这个参数并不是一个简单的分割用的字符,而是一个正则表达式,
他对一些特殊的字符可能会出现你预想不到的结果,比如测试下面的代码:

(1) 用竖线 | 分隔字符串,你将得不到预期的结果

String[] aa = “aaa|bbb|ccc”.split(“|”); //String[] aa = “aaa|bbb|ccc”.split(“\\|”); 这样才能得到正确的结果 for (int i = 0 ; i <aa.length ; i++ ) { System.out.println(“–“+aa); }

(2)用竖 * 分隔字符串运行将抛出java.util.regex.PatternSyntaxException异常,用加号 + 也是如此。

String[] aa = “aaa*bbb*ccc”.split(“*”); //String[] aa = “aaa|bbb|ccc”.split(“\\*”); 这样才能得到正确的结果 for (int i = 0 ; i <aa.length ; i++ ) { System.out.println(“–“+aa); }

(3)显然,+ * 不是有效的模式匹配规则表达式,用”\\*” “\\+”转义后即可得到正确的结果。
(4) “|” 分隔串时虽然能够执行,但是却不是预期的目的,”\\|”转义后即可得到正确的结果。
(5)还有如果想在串中使用””字符,则也需要转义.首先要表达”aaaa\bbbb”这个串就应该用”aaaa\\bbbb”,如果要分隔就应该这样才能得到正确结果:
String[] aa = “aaa\\bbb\\bccc”.split(\\\\);
(6) 还有就是点号”.”,也要首先转义才能得到正确的结果。

第一种方法:

string s="abcdeabcdeabcde"; 
string[] sArray=s.Split('c') ; 
foreach(string i in sArray) Console.WriteLine(i.ToString());

输出下面的结果:
ab
deab
deab
de

第二种方法:
我们看到了结果是以一个指定的字符进行的分割。使用另一种构造方法对多个字符进行分割:

string s="abcdeabcdeabcde"; 
string[] sArray1=s.Split(new char[3]{'c','d','e'}) ; 
foreach(string i in sArray1) Console.WriteLine(i.ToString());

可以输出下面的结果:
ab
ab
ab

第三种方法:
除了以上的这两种方法以外,第三种方法是使用正则表达式。新建一个控制台项目。
然后先添加 using System.Text.RegularExpressions;

using System.Text.RegularExpressions 
string content=agcsmallmacsmallgggsmallytx;
string[] resultString=Regex.Split(content,small,RegexOptions.IgnoreCase) 
foreach(string i in resultString) Console.WriteLine(i.ToString());

输出下面的结果:
agc
mac
ggg
ytx

第四种方法:

string str1="我*****是*****一*****个*****教*****师"; 
string[] str2; 

str1=str1.Replace("*****","*") ; 
str2=str1.Split(’*‘) ; 

foreach(string i in str2) Console.WriteLine(i.ToString());

第五种方法:
string str1=”我**是*****一*****个*****教*****师“;
我希望显示的结果为:我是一个教师。 我如果采用上面的第四种方法来做就会产生下面的错误:我 是一个教师。中间有空格输出,所以输出结果并不是希望的结果,这就又回到了正则表达式了,这时可以采用下面的第五种方法:

string str1   ="我**是*****一*****个*****教*****师"; 
string[] str2 = System.Text.RegularExpressions.Regex.Split(str1,@[*]+); 
foreach(string i in str2) Console.WriteLine(i.ToString());

这里通过[*]+ 巧妙的完成了我们的目标。

3. StringTokenizer的用法及示例:

StringTokenizer类:根据自定义字符为分界符进行拆分,并将结果进行封装提供对应方法进行遍历取值,StringTokenizer 方法不区分标识符、数和带引号的字符串,它们也不识别并跳过注释;该方法用途类似于split方法,只是对结果进行了封装;

帮助文档上对此进行了说明:

StringTokenizer 是出于兼容性的原因而被保留的遗留类(虽然在新代码中并不鼓励使用它)。建议所有寻求此功能的人使用 String 的 split 方法或 java.util.regex 包。

1、构造函数。

1. StringTokenizer(String str) :构造一个用来解析str的StringTokenizer对象。java默认的分隔符是“空格”、“制表符(‘\t’)”、“换行符(‘\n’)”、“回车符(‘\r’)”。
2. StringTokenizer(String str, String delim) :构造一个用来解析str的StringTokenizer对象,并提供一个指定的分隔符。
3. StringTokenizer(String str, String delim, boolean returnDelims) :构造一个用来解析str的StringTokenizer对象,并提供一个指定的分隔符,同时,指定是否返回分隔符。

其中,str为需分析的字符串,delim为定界符,定界符里面的任何一个字符都是分隔符,如”+-*/   “表示碰到”+-*/   “中的任何一个都认为是到达了分隔符了。

2、方法。
说明:所有方法均为public;

1. int countTokens() :返回nextToken方法被调用的次数。如果采用构造函数1和2,返回的就是分隔符数量(例2)。
2. boolean hasMoreTokens() :返回是否还有分隔符。
3. boolean hasMoreElements() :结果同2。
4. String nextToken() :返回从当前位置到下一个分隔符的字符串。
5. Object nextElement() :结果同4。
6. String nextToken(String delim) :与4类似,以指定的分隔符返回结果。

先看个例子:

	//import java.util.StringTokenizer; 
	public static void main(String[] args)
	{
		
		StringTokenizer st = new StringTokenizer("www.ikeepstudying.com", ".i");  
	 	while(st.hasMoreElements()){  
	 		System.out.println("Token:" + st.nextToken());  
	 	}  
	}

输出:
Token:www
Token:keepstudy
Token:ng
Token:com

    String s = new String("The Java platform is the ideal platform for network computing");
    StringTokenizer st = new StringTokenizer(s);
    System.out.println( "Token Total: " + st.countTokens() );
    while( st.hasMoreElements() ){
        System.out.println( st.nextToken() );
    }

结果为:

Token Total: 10
The
Java
platform
is
the
ideal
platform
for
network
computing
String s = new String("The=Java=platform=is=the=ideal=platform=for=network=computing");StringTokenizer st = new StringTokenizer(s,"=",true);
System.out.println( "Token Total: " + st.countTokens() );
while( st.hasMoreElements() ){
    System.out.println( st.nextToken() );
}
结果为:
Token Total: 19
The
=
Java
=
platform
=
is
=
the
=
ideal
=
platform
=
for
=
network
=
computing

4. indexOf,lastIndexOf的用法及示例:

lastIndexOf方法

返回 String 对象中子字符串最后出现的位置。

strObj.lastIndexOf(substring[, startindex])

参数
strObj

必选项。String 对象或文字。

substring

必选项。要在 String 对象内查找的子字符串。

startindex

可选项。该整数值指出在 String 对象内进行查找的开始索引位置。假如省略,则查找从字符串的末尾开始。

说明
lastIndexOf 方法返回一个整数值,指出 String 对象内子字符串的开始位置。假如没有找到子字符串,则返回 -1。

假如 startindex 是负数,则 startindex 被当作零。假如它比最大字符位置索引还大,则它被当作最大的可能索引。

从右向左执行查找。否则,该方法和 indexOf 相同。

下面的示例说明了 lastIndexOf 方法的用法:

function lastIndexDemo(str2)
{
   var str1 = "BABEBIBOBUBABEBIBOBU"
   var s = str1.lastIndexOf(str2);
   return(s);
}

str2="OB";
s=17;

 

indexOf方法

返回 String 对象内第一次出现子字符串的字符位置。

strObj.indexOf(subString[, startIndex])

参数
strObj

必选项。String 对象或文字。

subString

必选项。要在 String 对象中查找的子字符串。

starIndex

可选项。该整数值指出在 String 对象内开始查找的索引。假如省略,则从字符串的开始处查找。

说明
indexOf 方法返回一个整数值,指出 String 对象内子字符串的开始位置。假如没有找到子字符串,则返回 -1。

假如 startindex 是负数,则 startindex 被当作零。假如它比最大的字符位置索引还大,则它被当作最大的可能索引。

从左向右执行查找。否则,该方法与 lastIndexOf 相同。

示例
下面的示例说明了 indexOf 方法的用法。

function IndexDemo(str2){
   var str1 = "BABEBIBOBUBABEBIBOBU"
   var s = str1.indexOf(str2);
   return(s);
}

下面的例子说明了如何使用java.lang.String.indexOf()方法

package com.yiibai;

import java.lang.*;

public class StringDemo {

  public static void main(String[] args) {
  
    String str1 = "Collections of tutorials at tutorials point";
  
    // returns index of first character of the substring "tutorials" 
    System.out.println("index =  " + str1.indexOf("tutorials")); 
      
    // returns -1 as substring "admin" is not located
    System.out.println("index =  " + str1.indexOf("admin"));    
  }
}

让我们来编译和运行上面的程序,这将产生以下结果:

index = 15
index = -1

 

本文:Java 字符串分割截取的方法 (substring,split,StringTokenizer,indexOf,lastIndexOf)

Leave a Reply