Go语言---strings包(字符串操作)_strings_gensplit-程序员宅基地

技术标签: Golang语言  Go  strings包  

strings标准库包主要涉及字符串的基本操作。

常见字符串的操作有:

  • 字符串求长度
  • 求子串
  • 是否存在某个字符或者子串
  • 子串出现的次数(字符串匹配)
  • 字符串分割(切分)成[]string
  • 字符串是否存在某个前缀或后缀
  • 字符或者子串在字符串中首次出现的位置或最后一次出现的位置
  • 通过某个字符串将[]string进行拼接
  • 字符串重复次数
  • 字符串中子串替换
  • 大小写转换
  • ......................等等一些基本操作。

由于string类型可以看成是一种特殊的slice类型,因此获取长度可以用内置的函数len;同时支持 切片 操作,因此,子串获取很容易。

说明:这里说的字符是rune类型,即一个UTF-8字符(Unicode代码点)。

----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

子串

是否存在某个字符或子串

// 子串substr在s中,返回true
func Contains(s, substr string) bool
// chars中任何一个Unicode代码点在s中,返回true
func ContainsAny(s, chars string) bool
// Unicode代码点r在s中,返回true
func ContainsRune(s string, r rune) bool

示例代码:ContainsAny 函数说明

fmt.Println(strings.ContainsAny("team", "i"))              //false
fmt.Println(strings.ContainsAny("failure", "u & i"))       //true
fmt.Println(strings.ContainsAny("in failure", "s g"))      //true
fmt.Println(strings.ContainsAny("foo", ""))                //false
fmt.Println(strings.ContainsAny("", ""))                   //false

第二个参数 chars 中任意一个字符(Unicode Code Point)如果在第一个参数 s 中存在,则返回true。

上述三个函数的源码都是调用函数Index(子串出现的位置函数),然后和0比较返回true或false。如,contains函数:

func Contains(s, substr string) bool {
    return Index(s, substr) >= 0
}

字符或子串在字符串中出现的位置

//返回子串sep在字符串s中第一次出现的索引值,不在的话返回-1.
func Index(s, sep string) int
//chars中任何一个Unicode代码点在s中首次出现的位置,不存在返回-1
func IndexAny(s, chars string) int
//查找字符 c 在 s 中第一次出现的位置,其中 c 满足 f(c) 返回 true
func IndexFunc(s string, f func(rune) bool) int   //rune类型是int32别名,UTF-8字符格式编码。
//返回字符c在s中第一次出现的位置
func IndexByte(s string, c byte) int   //byte是字节类型
// Unicode 代码点 r 在 s 中第一次出现的位置
func IndexRune(s string, r rune) int
//查找最后一次出现的位置
func LastIndex(s, sep string) int
func LastIndexByte(s string, c byte) int
func LastIndexAny(s, chars string) int
func LastIndexFunc(s string, f func(rune) bool) int

示例:IndexFunc 的例子。

fmt.Printf("%d\n", strings.IndexFunc("studygolang", func(c rune) bool {
    if c > 'u' {
        return true
    }
    return false
}))      //输出:4    匿名函数传递  因为 y 的 Unicode 代码点大于 u 的代码点。带入匿名函数进行比较

子串出现次数

func Count(s, sep string) int   //子串在s字符串中出现的次数

(1)、特别说明一下的是当 sep 为空时,Count 的返回值是:utf8.RuneCountInString(s) + 1

(2)、Count 是计算子串在字符串中出现的无重叠的次数

字符串是否有某个前缀或后缀

// s 中是否以 prefix 开始
func HasPrefix(s, prefix string) bool {
    return len(s) >= len(prefix) && s[0:len(prefix)] == prefix
}
// s 中是否以 suffix 结尾
func HasSuffix(s, suffix string) bool {
    return len(s) >= len(suffix) && s[len(s)-len(suffix):] == suffix
}

golang语言中的rune类型

转载链接:http://ju.outofmemory.cn/entry/245284

Rune 是int32 的别名。用UTF-8 进行编码。这个类型在什么时候使用呢?例如需要遍历字符串中的字符。可以循环每个字节(仅在使用US ASCII 编码字符串时与字符等价,而它们在Go中不存在!)。因此为了获得实际的字符,需要使用rune类型。在UTF-8 世界的字符有时被称作runes。通常,当人们讨论字符时,多数是指8 位字符。UTF-8 字符可能会有32 位,称作rune。

例如 s:="Go编程" fmt.Println(len(s)) 输出结果应该是8    因为中文字符是用3个字节存的。

len(string(rune('编'))) 的结果是3

如果想要获得我们想要的情况的话,需要先转换为rune切片再使用内置的len函数

fmt.Println(len([]rune(s))) 结果就是 4 了。

所以用string存储 unicode 的话,如果有中文,按下标是访问不到的,因为你只能得到一个 byte 。 要想访问中文的话,还是要用rune切片,这样就能按下表访问。

----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

字符串转换

func ToUpper(s string) string
func ToLower(s string) string
func ToTitle(s string) string

func ToUpperSpecial(_case unicode.SpecialCase, s string) string
func ToLowerSpecial(_case unicode.SpecialCase, s string) string
func ToTitleSpecial(_case unicode.SpecialCase, s string) string

func Title(s string) string
------------------------------------------------------------------------------------------------------------------- ---------------------------------------------------------------------------------------------------------------

比较

func Compare(a, b string) int  //返回不相等-1或者  相等0

func EqualFold(s, t string) bool
------------------------------------------------------------------------------------------------------------------- ---------------------------------------------------------------------------------------------------------------

清理

func Trim(s string, cutset string) string                 //去除字符串的头尾子字符串
func TrimLeft(s string, cutset string) string
func TrimRight(s string, cutset string) string

func TrimFunc(s string, f func(rune) bool) string         //函数
func TrimLeftFunc(s string, f func(rune) bool) string
func TrimRightFunc(s string, f func(rune) bool) string

func TrimSpace(s string) string //字符串前后空格  fmt.Println(strings.TrimSpace(" \t\n a lone gopher \n\t\r\n"))  输出:a lone gopher

func TrimPrefix(s, prefix string) string
func TrimSuffix(s, suffix string) string

代码示例:

func main(){
	var s = "aaasddfgaaaa"

	fun := func (c rune) bool {
		if c != 'a'{
			return false
		}
		return true
	}
	fmt.Println(strings.TrimFunc(s, fun))   //输出   sddfg
}
------------------------------------------------------------------------------------------------------------------- ---------------------------------------------------------------------------------------------------------------

拆合函数

Fields

func Fields(s string) []string
func FieldsFunc(s string, f func(rune) bool) []string

Fields 用一个或多个连续的空格分隔字符串 s,返回子字符串的数组(slice)。如果字符串 s 只包含空格,则返回空列表([]string的长度为0)。其中,空格的定义是 unicode.IsSpace,之前已经介绍过。

由于是用空格分隔,因此结果中不会含有空格或空子字符串。

FieldsFunc 用这样的Unicode代码点 c 进行分隔:满足 f(c) 返回 true。该函数返回[]string。如果字符串 s 中所有的代码点(unicode code points)都满足f(c)或者 s 是空,则 FieldsFunc 返回空slice。也就是说,我们可以通过实现一个回调函数来指定分隔字符串 s 的字符。

示例:

fmt.Printf("Fields are: %q", strings.Fields("  foo bar  baz   "))
fmt.Println(strings.FieldsFunc("  foo bar  baz   ", unicode.IsSpace))

split

这四个函数放在一起讲,是因为是通过同一个内部函数实现的。

func Split(s, sep string) []string { return genSplit(s, sep, 0, -1) }
func SplitAfter(s, sep string) []string { return genSplit(s, sep, len(sep), -1) }
func SplitN(s, sep string, n int) []string { return genSplit(s, sep, 0, n) }
func SplitAfterN(s, sep string, n int) []string { return genSplit(s, sep, len(sep), n) }
它们都调用了 genSplit 函数。

这四个函数都是通过 sep 进行分割,返回[]string。如果 sep 为空,相当于分成一个个的 UTF-8 字符,如 Split("abc",""),得到的是[a b c]。

Split(s, sep) 和 SplitN(s, sep, -1) 等价;SplitAfter(s, sep) 和 SplitAfterN(s, sep, -1) 等价。

那么,Split 和 SplitAfter 有啥区别呢?通过这两句代码的结果就知道它们的区别了:

fmt.Printf("%q\n", strings.Split("foo,bar,baz", ","))         //  ["foo" "bar" "baz"]
fmt.Printf("%q\n", strings.SplitAfter("foo,bar,baz", ","))    //  ["foo," "bar," "baz"]

也就是说,Split 会将 s 中的 sep 去掉,而 SplitAfter 会保留 sep

带 N 的方法可以通过最后一个参数 n 控制返回的结果中的 slice 中的元素个数,当 n < 0 时,返回所有的子字符串;当 n == 0 时,返回的结果是 nil;当 n > 0 时,表示返回的 slice 中最多只有 n 个元素,其中,最后一个元素不会分割,比如:

fmt.Printf("%q\n", strings.SplitN("foo,bar,baz", ",", 2))     // ["foo" "bar,baz"]

Join

func Join(a []string, sep string) string

将字符串数组(或slice)连接起来可以通过 Join 实现。

假如没有这个库函数,我们自己实现一个,我们会这么实现:

func Join(str []string, sep string) string {
    // 特殊情况应该做处理
    if len(str) == 0 {
        return ""
    }
    if len(str) == 1 {
        return str[0]
    }
    buffer := bytes.NewBufferString(str[0])
    for _, s := range str[1:] {
        buffer.WriteString(sep)
        buffer.WriteString(s)
    }
    return buffer.String()
}

使用了 bytes 包的 Buffer 类型,避免大量的字符串连接操作(因为 Go 中字符串是不可变的)。

标准库的实现:

func Join(a []string, sep string) string {
    if len(a) == 0 {
        return ""
    }
    if len(a) == 1 {
        return a[0]
    }
    n := len(sep) * (len(a) - 1)
    for i := 0; i < len(a); i++ {
        n += len(a[i])
    }

    b := make([]byte, n)       //借助 字节切片实现
    bp := copy(b, a[0])        
    for _, s := range a[1:] {
        bp += copy(b[bp:], sep)
        bp += copy(b[bp:], s)
    }
    return str

标准库的实现没有用 bytes 包,当然也不会简单的通过 + 号连接字符串。Go 中是不允许循环依赖的,标准库中很多时候会出现代码拷贝,而不是引入某个包。这里 Join 的实现方式挺好,我个人猜测,不直接使用 bytes 包,也是不想依赖 bytes 包(其实 bytes 中的实现也是 copy 方式)。

字符串重复次数

func Repeat(s string, count int) string
------------------------------------------------------------------------------------------------------------------- ---------------------------------------------------------------------------------------------------------------

替换

// 用 new 替换 s 中的 old,一共替换 n 个。
// 如果 n < 0,则不限制替换次数,即全部替换
func Replace(s, old, new string, n int) string
func Map(mapping func(rune) rune, s string) string   //满足函数实现的进行替换
------------------------------------------------------------------------------------------------------------------- ---------------------------------------------------------------------------------------------------------------

Replacer

这是一个结构,没有导出任何字段(字段值小写),实例化通过

// A Replacer replaces a list of strings with replacements.
    	type Replacer struct {
    		r replacer    //接口类型
    	}
    	
    	// replacer is the interface that a replacement algorithm needs to implement.
    	type replacer interface {
    		Replace(s string) string
    		WriteString(w io.Writer, s string) (n int, err error)
    	}
func NewReplacer(oldnew ...string) *Replacer

函数进行,其中不定参数 oldnew 是 old-new 对,即进行多个替换。

type Replacer struct { ... }

// 创建一个替换规则,参数为“查找内容”和“替换内容”的交替形式。
// 替换操作会依次将第 1 个字符串替换为第 2 个字符串,将第 3 个字符串
// 替换为第 4 个字符串,以此类推。
// 替换规则可以同时被多个例程使用。
func NewReplacer(oldnew ...string) *Replacer

// 使用替换规则对 s 进行替换并返回结果。
func (r *Replacer) Replace(s string) string

// 使用替换规则对 s 进行替换并将结果写入 w。
// 返回写入的字节数和遇到的错误。
func (r *Replacer) WriteString(w io.Writer, s string) (n int, err error)

程序示例:

r := strings.NewReplacer("<", "<", ">", ">")
fmt.Println(r.Replace("This is <b>HTML</b>!"))    // 输出结果是   This is &lt;b&gt;HTML&lt;/b&gt;!
------------------------------------------------------------------------------------------------------------------- ---------------------------------------------------------------------------------------------------------------

Reader

看到名字就能猜到,这是实现了 io 包中的接口。它实现了 io.Reader(Read 方法),io.ReaderAt(ReadAt 方法),io.Seeker(Seek 方法),io.WriterTo(WriteTo 方法),io.ByteReader(ReadByte 方法),io.ByteScanner(ReadByte 和 UnreadByte 方法),io.RuneReader(ReadRune 方法) 和 io.RuneScanner(ReadRune 和 UnreadRune 方法)。

Reader 结构如下:

type Reader struct {
    s        string    // Reader 读取的数据来源
    i        int       // current reading index(当前读的索引位置)
    prevRune int       // index of previous rune; or < 0(前一个读取的 rune 索引位置)
}

可见 Reader 结构没有导出任何字段,而是提供一个实例化方法:

func NewReader(s string) *Reader

该方法接收一个字符串,返回的 Reader 实例就是从该参数字符串读数据。在后面学习了 bytes 包之后,可以知道 bytes.NewBufferString 有类似的功能,不过,如果只是为了读取,NewReader 会更高效

func (r *Reader) Read(b []byte) (n int, err error)
func (r *Reader) ReadAt(b []byte, off int64) (n int, err error)
func (r *Reader) WriteTo(w io.Writer) (n int64, err error)
func (r *Reader) Seek(offset int64, whence int) (int64, error)

func (r *Reader) ReadByte() (byte, error)
func (r *Reader) UnreadByte() error

func (r *Reader) ReadRune() (ch rune, size int, err error)
func (r *Reader) UnreadRune() error

func (r *Reader) Len() int
func (r *Reader) Size() int64
func (r *Reader) Reset(s string)

其他方法不介绍了,都是之前接口的实现,有兴趣的可以看看源码实现比较简单易懂,大部分都是根据 i、prevRune 两个属性来控制。

参考网址:http://www.cnblogs.com/golove/p/3236300.html

                 https://books.studygolang.com/The-Golang-Standard-Library-by-Example/chapter02/02.1.html

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/li_101357/article/details/80241224

智能推荐

《程序员每日英语》_并不是每个人都明白英语的重要性。-程序员宅基地

文章浏览阅读4.2w次,点赞6次,收藏6次。csdn的排版不是很好,更好的排版可以从下边链接查看原文链接(点击即可)学习原因 大一大二英语课几乎就是玩过去的,也没听会啥东西,四级也是过得踉踉跄跄,觉得英语也没啥用(我是典型的认为有用才学的那种人,电路,高数那么难我也能学的非常好),但就是英语不行,也没想那么多,反正大家都一般(可见当时思想觉悟还是不行啊) 不过大二下就开始接触编程了,英..._并不是每个人都明白英语的重要性。

test for net with asd&&dice_python decollate_batch-程序员宅基地

文章浏览阅读237次。测试记录后处理asddicenet_python decollate_batch

循环遍历的过程中删除集合中的元素 报 “ java.util.ConcurrentModificationException: null ”_java循环移除集合报null-程序员宅基地

文章浏览阅读352次。今天想要在循环遍历的过程中删除集合中的元素,但是报了一个这样的bug :java.util.ConcurrentModificationException: null可以翻译成“并发修改异常”。测试时就报错了,后面也是上网查了下原因,不能用这种方式移除:原因:循环的时候,进行了删除的操作,才会报这种错,因为:迭代器的modCount和expectedModCount的值不一致;循环中是一个迭代器来进行迭代的(参考java forEach实现原理). 可以去看一下它的iterator.._java循环移除集合报null

kafka的集群搭建,一起来学习吧!_kafka schema registry 集群搭建-程序员宅基地

文章浏览阅读172次。启动zookeeper在本地2181端口启动ZK。zookeeper集群启动参考 https://blog.csdn.net/qiushisoftware/article/details/79043379bin/zookeeper-server-start.sh config/zookeeper.properties1如果你需要对zookeeper开启SASL认证,请在配置文件中加..._kafka schema registry 集群搭建

java学习日记11-程序员宅基地

文章浏览阅读112次。1.对象与类类是一个标准,是需要被定义的,就跟int的一样,int是java已经被定义的一个类,现在我们也能定义一个类。而每一个对象是类的具体体现,用来做事。EG:对象: 属性或者状态+ 服务数据:属性或者状态操作:函数里面是蛋黄,外面是 蛋白。数据 操作封装:数据和数据的操作放在一个地方人只能通过外面的操作要求对象做点事情,提供点服务,可是内部的数据应该是由对象本身所保护着的...

git 使用writer_熟悉使用Github,VS进行项目的开发(第二次作业)-程序员宅基地

文章浏览阅读112次。声明:本次博客部分细节内容参考了项目背景:阿超家里的孩子上小学一年级了,这个暑假老师给家长们布置了一个作业:家长每天要给孩子出一些合理的,但要有些难度的四则运算题目,并且家长要对孩子的作业打分记录。作为程序员的阿超心想,既然每天都需要出题,那何不做一个可以自动生成小学四则运算题目与解决题目的命令行 “软件”呢。他把老师的话翻译一下,就形成了这个软件的需求:程序接收一个命令行参数 n,然后随机产生..._github triage和writer

随便推点

计算机毕业设计Java进出口食品安全信息管理系统(源码+系统+mysql数据库+lw文档)_食品进出口安全管理系统-程序员宅基地

文章浏览阅读536次。计算机毕业设计Java进出口食品安全信息管理系统(源码+系统+mysql数据库+lw文档)本源码技术栈:项目架构:B/S架构开发语言:Java语言开发软件:idea eclipse前端技术:Layui、HTML、CSS、JS、JQuery等技术后端技术:JAVA运行环境:Win10、JDK1.8数 据 库:MySQL5.7/8.0源码地址:https://pan.baidu.com/s/1F-2rhQO942h7Xh1Y_KXJtw?pwd=haff最新计算机专业原创开发毕业设计源码+数据库是近期作品_食品进出口安全管理系统

PyQt、PySide、PySide2这三者到底有什么区别?-程序员宅基地

文章浏览阅读7.6w次,点赞34次,收藏87次。前言总所周知,Python语言在这两年确实很火,作为一种“胶水”语言,似乎它是万能的,什么都能做,这依赖于它能够支持无数的外部库,这使得Python就变得无比强大。那么身为Qt的开发者,也自然不会放过Python语言的集成了,毕竟它这么牛叉,说不定哪天可以用到项目中来呢是吧,那就必须得提前了解一下了。那么,面对网上那么多支持的模块:PyQt、PySide、PySide2,到底该用哪一个呢?这几..._pyside

黑马程序员 Java面向对象——IO流(字节流读取流)_java面向对象io流答案-程序员宅基地

文章浏览阅读408次。---------------------- ASP.Net+Unity开发、.Net培训、期待与您交流! ----------------------面向对象字节流基类 InputStreamOutputStream/*写入文件*/import java.io.OutputSt_java面向对象io流答案

Unity3d背包系统实现(包括UI设计以及代码框架_unity3d背包系统实现(包括ui设计以及代码框架-程序员宅基地

文章浏览阅读4.1k次。前言时隔一个月,做了自己的这里写自定义目录标题前言欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程..._unity3d背包系统实现(包括ui设计以及代码框架

Java架构师Day06-分布式架构策略之分布式架构中间件-程序员宅基地

文章浏览阅读570次。分布式架构中间件分布式消息通信消息中间件在分布式架构中的应用ActiveMQ高可用集群企业级部署方案ActiveMQ P2P,PUB,SUB模型详解ActiveMQ消息确认及重发策略ActiveMQ基于Spring完成分布式消息队列实战Kafka基于Zookeeper搭建高可用集群实战Kafka消息处理过程剖析Java客户端实现Kafka生产者与消费者实例Kafka的副本机制及选举策略基于Kafka实现应用日志实时上报统计分析RabbitMQ及高可用集群部署详解RabbitMQ消息分发机制及主题消息分发Ra

数据库备份与恢复方案-程序员宅基地

文章浏览阅读1.9k次。数据安全性随着计算机的普及和信息技术的进步,特别是计算机网络的飞速发展,信息安全的重要性日趋明显。数据备份是保证信息安全的一个重要方法。只要发生数据传输、数据存储和数据交换,就有可能产生数据故障。这时,如果没有采取数据备份和数据恢复手段与措施,就会导致数据的丢失。有时造成的损失是无法弥补与估量的。数据故障的形式是多种多样的。通常,数据故障可划分为系统故障、事务故障和介质故障三大类。从..._网站数据库备份与恢复方案

推荐文章

热门文章

相关标签