当前位置:首页 > 工业控制 > 电子设计自动化
[导读]C 和 C++ 字符串字面量(String Literal)既有相同之处,又有一些区别。了解这些内容对于加深字符串字面量以及相关一些概念的理解、澄清一些常见的概念误区不无助益。本文以普通字符串字面量 "hello" 为例总结说明如

C 和 C++ 字符串字面量(String Literal)既有相同之处,又有一些区别。了解这些内容对于加深字符串字面量以及相关一些概念的理解、澄清一些常见的概念误区不无助益。本文以普通字符串字面量 "hello" 为例总结说明如下。

如果你发现了本文中的错误,或者对本文有什么感想或建议,可通过 whyglinux AT gmail DOT com 邮箱和作者联系。

相同点:

[list][*]字符串字面量是对象

C/C++ 中的对象(Object)指的是一块存储区。字符串字面量是不需要创建过程就可使用的对象,所以它既没有变量那样的声明或者定义(字符串字面量是无名对象),也不需要象动态分配的对象那样进行动态分配。由于这个原因,用来限定变量的类型限定符(如 const、volatile)以及存储类别指示符(如 extern、static、auto、register)不能用在修饰字符串字面量上。

[*] 数组类型

字符串字面量是数组类型的对象,因而具有数组的一切特点。关于这一点在下面还会进一步说明。

[*] 静态存储期

C/C++ 中对象的生存期按照其存储性质可分为三类:静态存储期(static storage duration)、自动存储期(automatic storage duration)以及动态存储期(dynamic storage duration)。相应地,对象可根据存储期性质分为静态对象、自动对象和动态对象三种。

字符串字面量是静态对象,所以在程序运行期间会一直存在。

[*] 字符串字面量是左值,而且是不可被更改的左值

例如,char s[] = "hello"; 中的 “hello” 是数组类型的左值(lvalue),用于初始化 s 数组;sizeof( "hello" ) 以及 &"hello" 中的 "hello" 也都是左值。在这些情况下,"hello" 处于左值语义上下文环境中,所以不会产生下面将要提到的数组转换为指针的现象。

另外,有些运算不但要求其操作数是左值,还要求可变。例如,对对象进行赋值、自加、自减等运算。因为数组是不可被更改的左值,所以不能对数组进行这些操作,也就是说不存在数组类型的赋值、自加、自减等运算。

[*]字符串字面量可以转换为指向其首第一个字符的指针

处于右值语义环境中的字符串字面量将被默认转换为指向第一个字符的指针。例如,char* p = "hello"; 中的 “hello” 在转换为字符指针后用于初始化指针变量 p;表达式 "hello"[0](相当于 *("hello" + 0) 或者 *"hello")中的 “hello” 也是同样转换为指针后参与下标运算,等等。

这种性质也是数组类型的特点。在右值语义环境下,一般类型的对象表示的值是由其存储内容决定的;而数组类型的对象与此不同,它代表的值不是来源于其内容,而是来源于数组对象首元素所在的地址。这是数组最为特殊的地方,也是人们容易产生误解的地方。

[*] 取址运算

字符串字面量是一个可取址的对象。例如:&"hello" 是合法的表达式。

[*] 地址常量

静态对象的地址在编译期间即可被确定,所以其地址(如 &"hello")是常量;而字符串字面量又可以从数组类型自动转换为指针(如 "hello" 转换为指针后等同于 &"hello"[0]),所以字符串字面量可以直接作为地址常量表达式来使用。

[*] 修改字符串字面量的行为是无定义的

下面的操作都试图修改字符串字面量中的第一个字符从而改变字符串字面量,所以其结果是无定义(Undefined)的:

”hello”[0] = ‘A’; /* Undefined */
char* p = “hello”; *p = ‘A’; /* Undefined */

使用了无定义行为的程序是错误的;避免在程序中出现无定义行为是程序员的责任。

[/list]
区别点:
[list][*]在类型限定上的不同

C 中的字符串字面量 "hello" 是数组类型 char[6](相应地,每个字符元素是无 const 限定的 char 型);作为右值使用的时候转换为指针类型 char*。

在 C++ 中 "hello" 是 char const [6] 类型(相应地,每个字符元素的类型是 char const);转换为指针使用的时候是 char const*、在特殊情况下也可以是 char*。

之所以在 C 中字符串字面量不是 const 数组(也就是说每个字符元素的类型不是 char const),是因为 C 要照顾或者考虑到标准制定之前已经存在的大量代码——那时的 C 语言还没有 const 关键字,如果硬性规定为 const 数组,则 char* p = "hello"; 这样的初始化或者 char* q; q = "hello"; 这样的赋值就是非法的了(因为右边的类型 char const* 不能默认转换为左边的类型 char* )。

同样,为了使上述代码能顺利通过编译过程,C++ 采取了另外一种策略:它规定了字符串字面量的类型是 const 数组,同时又特别规定了字符串字面量也可以有限制地转换为指向非常量的指针(对于 "hello" 来说就是 char*),从而解决了上述代码中存在的问题。不过,转换到 char* 主要是为了兼容以前的代码,这种转换被 C++ 标准标记为“Deprecated”,所以在写程序的时候不应该依赖于这种转换。

[*]C++ 中的字符串字面量是常量,而在 C 中不是常量。

正是由于标准在类型上的不同规定造成了在 C 和 C++ 中字符串字面量常量性质上的差别。

在 C 中,除了 string literals 和 compound literals(C99 only)之外,其它的 literals 都是常量;而在 C++ 中,包括 string literals 在内的所有 literals 都是常量(注意:C++ 中不存在 compound literals。)

在现实中,经常可以看到用“字符串常量”来指代“字符串字面量”的情况,其实对于 C 来说这是不正确的,因为在 C 中字符串字面量不属于常量;而对于 C++ 来说,“字符串常量”和“字符串字面量”实际上是一回事,只不过看问题的角度不同罢了。

顺便提一下:C++ 中的常量可以有对象常量(如字符串字面量、const 限定的对象)和非对象常量之分,而 C 中的常量不包含对象,它们最明显的特征就是不能进行取址运算,因此常量只能作为非左值(即右值)来使用。

[*]语法及语义上的区别

C 中的字符串字面量不是常量,它的每个字符元素也不是常量,所以字符元素的不可变性仅仅表现在语义层面,但在语法和约束条件上没有要求。而 C++ 中字符串字面量是常量,每个字符元素也是常量,因此在语义和约束条件两方面都要求不能改变其中的每个字符元素;另外,出于兼容性考虑 C++ 还存在着特殊情况下的向非 const 指针的转换。

下面用具体的代码来对以上内容进行说明。

*"hello" = 'A';

表达式 *"hello" 代表字符串字面量的第一个字符元素对象。上述语句试图通过赋值操作改变第一个元素,当然这样的行为在 C 和 C++ 中都是无定义的。除了这个相同点外,还有如下的一些细微的区别:

在 C++ 中,*"hello" 是一个 const 对象(其类型是 const char。注意:这里的 "hello" 不会转换为 char* 指针、从而 *"hello" 不会是 char 类型),所以上述赋值违反了赋值号左操作数必须是一个可被改变的左值的约束条件。在此情况下,标准要求给出诊断信息。

在 C 中,*"hello" 是一个非 const 对象(其类型是 char),是一个可被改变的左值,所以不违背赋值的约束条件。在此情况下,尽管这个赋值操作是未定义的,标准对诊断信息没有要求。

char* p = "hello";
char* q; q = "hello";
void foo( char* s ); foo( "hello" );

上面的初始化和赋值语句中 "hello" 都能转换为 char* 指针类型,所以都是合法的。在 C++ 中,尽管 "hello" 作为指针使用时是 char const * 类型,在此情况下(如果不是 char* 类型则初始化或者赋值不能成立)基于对字符串字面量的特殊规定使它可以转换为 char * 使用。

要注意 C++ 中字符串字面量转换为指向非常量的指针是有限制的,仅仅在有明确的目标类型要求的情况下才能进行这样的转换,否则是非法的。比如下面的情况:

char* p = "hello" + 1;
char* q; q = "hello" + 1;
void foo( char* s ); foo( "hello" + 1 );

上述是合法的 C 代码,但是作为 C++ 代码是非法的。非法的原因在于:"hello" 转换为 char const * 指针类型,而不能转换为 char *,因为 + 运算符对其操作数的类型没有转换为 char* 这样直接的要求(因为无论是 char const * 还是 char* 都能进行指针加法运算),所以指针加法表达式的结果仍然是 char const * 类型。这样,上面指针的初始化或赋值操作就违反了在类型上的约束条件,需要给出诊断信息。



来源:ks990次

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

字符串是C语言中最基础的概念,也是最常被用到的。在嵌入式开发中,我们经常要将一些字符串通过串口显示到串口助手或调试终端上,作为信息提示,以便让我们了解程序的运行情况;或者是将一些常量的值转为字符串,来显示到液晶等显示设备...

关键字: 字符串 指针 C 语言

大家好,我是杂烩君。嵌入式大杂烩周记主要是一些实用项目学习分享,每篇一个主题。SDS 是 C 的字符串库,旨在通过添加堆分配的字符串来增强有限的 libc 字符串处理功能。

关键字: 嵌入式 项目 字符串

Redis为什么那么快?除了它是内存数据库,使得所有的操作都在内存上进行之外,还有一个重要因素,它实现的数据结构,使得我们对数据进行增删查改操作时,Redis能高效的处理。因此,这次我们就来好好聊一下Redis数据结构,...

关键字: 数据结构 REDIS 字符串 节点

大家好,我是小林。前几天发了一篇「为了拿捏Redis数据结构,我画了20张图」,收获了很多好评,但是当时急于发文,有些地方没有写完,也有些地方写的不是很完善。然后我最近花了很多时间来完善文章,不仅加入了Redis新版本的...

关键字: 数据结构 REDIS 节点 字符串

道哥的第025篇原创一、前言二、最简单的格式化三、测试1:手动格式化数字四、测试2:混合格式化字符串和数字五、sprintf的实现机制六、总结一、前言在嵌入式项目开发中,字符串格式化是很常见的操作,我们一般都会使用C库中...

关键字: 字符串

在编写程序过程中,我们经常使用到一些字符串函数,例如求字符串长度,拷贝字符串......

关键字: C语言 字符串

今天,我将向您展示一种非常有用的技术,即使用grep命令查找多个字符串。 简而言之,grep命令可以看作是功能强大的命令行工具,可用于在一个或多个输入文件中查找与正则表达式匹配的文本,然后默认显示任何匹配的文本并将其记录...

关键字: Linux grep 字符串

把之前公众号发的文章重新排版进行整理,方便以后复习也方便大家浏览收藏。 讲这个例子前,咱们先来看一个简单的程序:字符串数组实现数字转字母: #include #include int main(void) { in...

关键字: C语言 字符串

一、沉浸式学习 以学习一门语言为例: 大多数人都持有一种观念,要真正学好一门语言必须得去所学语言当地学习或生活一段时间。 而事实上,大多数人都没有这样的学习条件。 解决问题的方法是: 自行改造环境,为自己创造沉浸式的学习...

关键字: 函数 字符串
关闭
关闭