网站建设 >

查看其它板块

c语言正则表达式函数,正则表达式 c语言

用C语言完成一个正则表达式的匹配：字符串中只有*和？是可变字符且位置和个数不固定，其他的字符位置固定

#includestdio.h

创新互联成立于2013年，是专业互联网技术服务公司，拥有项目网站设计、成都网站制作网站策划，项目实施与项目整合能力。我们以让每一个梦想脱颖而出为使命，1280元秀洲做网站,已为上家服务,为秀洲各地企业和个人服务,联系电话:028-86922220

#includestring.h

#include stdlib.h

//1、'?'很好处理，只要在原有的定位函数中加一点点就行：

int index(char *s,char *t,int pos)

{

int i=pos,j=0,lens=strlen(s),lent=strlen(t);

while(ilensjlent)

{

if(s[i]==t[j]||t[j]=='?')

{

++i;

++j;

}

else

{

i=i-j+1;

j=0;

}

if(j==lent)return i-lent;

else return -1;

}

/*2、'*'的处理有些麻烦，很自然的想法是'*'把整个T串分成若干不含'*'的子串，

拿这些子串依次匹配S串。

按这样的方法可以把S串分成两类：

A、T=T1*T2*...Tn*，其中Ti为不含'*'的子串，且不为空（T1可为空）。

B、T=T1*T2*...Tn

二者的差别只在于尾部是否有'*'。

拿T匹配S，

首先 T1匹配S头部，index(s,t1,0)==0

然后用循环完成后面的匹配，从前一次匹配后的末尾位置开始向后匹配，

如果匹配成功再把末尾位置记录下来。这里只用了最左匹配，为什么就足够了呢？

比如实际中的情况T1串可能在S串不止出现一次，为什么只考虑最左一个呢？

因为整个匹配过程是从左向右，最左匹配可以保证余下的S子中最长，更有利于后面T子串的匹配成功，

试想如果T1最左匹配不成功，靠右一些有可能成功吗？

例：T="*is*a*" S="this is a program"

T 子串"is"在S中有出现两个位置，匹配的时候只需要考虑最左边那个"is"就行了，

因为最左边的"is"匹配成功后，余下的S子串是" is a program"，余下的T子串是"*a"，

最左匹配可使余下的S子串最长，匹配的可能最大，最容易匹配的情况已经验证了，

就不用再做无用功了。

int match(char *s,char *t)

{

int i=0,j=0,lens=strlen(s),lent=strlen(t);

char buf[128];

int bufp=0;

while(jlentt[j]!='*')

{

buf[bufp]=t[j];

++bufp;++j;

}

buf[bufp]='\0';

if(index(s,buf,0)!=0)return 0;

i=bufp;

while(1)

{

while(jlentt[j]=='*')++j;

if(j==lent)return 1;

bufp=0;

while(jlentt[j]!='*')

{

buf[bufp]=t[j];

++bufp;++j;

}

buf[bufp]='\0';

if(j==lent)

{

if(index(s,buf,i)!=lens-bufp)return 0;

return 1;

}

if((i=index(s,buf,i))==-1)return 0;

i+=bufp;

}

void main()

{

char s[128];

char t[128]="mad*se$?243*.xml";

memset(s,'\0',128);//初始化s

printf("输入字符串,进行匹配\n");

gets(s);

if(match(s,t))

printf("匹配\n");

else

printf("不匹配\n");

}

C语言怎么用正则表达式

由于它可以极大地简化处理字符串时的复杂度，因此现在已经在许多 L i n u x 实用工具中得到了应用。千万不要以为正则表达式只是 P e r l 、 P y t h o n 、 B a s h 等脚本语言的专利，作为 C 语言程序员，用户同样可以在自己的程序中运用正则表达式。标准的 C 和 C + + 都不支持正则表达式，但有一些函数库可以辅助 C / C + + 程序员完成这一功能，其中最著名的当数 P h i l i p H a z e l 的 P e r l - C o m p a t i b l e R e g u l a r E x p r e s s i o n 库，许多 L i n u x 发行版本都带有这个函数库。编译正则表达式为了提高效率，在将一个字符串与正则表达式进行比较之前，首先要用 r e g c o m p ( ) 函数对它进行编译，将其转化为 r e g e x _ t 结构： i n t r e g c o m p ( r e g e x _ t * p r e g , c o n s t c h a r * r e g e x , i n t c f l a g s ) ; 参数 r e g e x 是一个字符串，它代表将要被编译的正则表达式；参数 p r e g 指向一个声明为 r e g e x _ t 的数据结构，用来保存编译结果；参数 c f l a g s 决定了正则表达式该如何被处理的细节。如果函数 r e g c o m p ( ) 执行成功，并且编译结果被正确填充到 p r e g 中后，函数将返回 0 ，任何其它的返回结果都代表有某种错误产生。匹配正则表达式一旦用 r e g c o m p ( ) 函数成功地编译了正则表达式，接下来就可以调用 r e g e x e c ( ) 函数完成模式匹配： i n t r e g e x e c ( c o n s t r e g e x _ t * p r e g , c o n s t c h a r * s t r i n g , s i z e _ t n m a t c h , r e g m a t c h _ t p m a t c h [ ] , i n t e f l a g s ) ; t y p e d e f s t r u c t { r e g o f f _ t r m _ s o ; r e g o f f _ t r m _ e o ; } r e g m a t c h _ t ; 参数 p r e g 指向编译后的正则表达式，参数 s t r i n g 是将要进行匹配的字符串，而参数 n m a t c h 和 p m a t c h 则用于把匹配结果返回给调用程序，最后一个参数 e f l a g s 决定了匹配的细节。在调用函数 r e g e x e c ( ) 进行模式匹配的过程中，可能在字符串 s t r i n g 中会有多处与给定的正则表达式相匹配，参数 p m a t c h 就是用来保存这些匹配位置的，而参数 n m a t c h 则告诉函数 r e g e x e c ( ) 最多可以把多少个匹配结果填充到 p m a t c h 数组中。当 r e g e x e c ( ) 函数成功返回时，从 s t r i n g + p m a t c h [ 0 ] . r m _ s o 到 s t r i n g + p m a t c h [ 0 ] . r m _ e o 是第一个匹配的字符串，而从 s t r i n g + p m a t c h [ 1 ] . r m _ s o 到 s t r i n g + p m a t c h [ 1 ] . r m _ e o ，则是第二个匹配的字符串，依此类推。释放正则表达式无论什么时候，当不再需要已经编译过的正则表达式时，都应该调用函数 r e g f r e e ( ) 将其释放，以免产生内存泄漏。 v o i d r e g f r e e ( r e g e x _ t * p r e g ) ; 函数 r e g f r e e ( ) 不会返回任何结果，它仅接收一个指向 r e g e x _ t 数据类型的指针，这是之前调用 r e g c o m p ( ) 函数所得到的编译结果。如果在程序中针对同一个 r e g e x _ t 结构调用了多次 r e g c o m p ( ) 函数， P O S I X 标准并没有规定是否每次都必须调用 r e g f r e e ( ) 函数进行释放，但建议每次调用 r e g c o m p ( ) 函数对正则表达式进行编译后都调用一次 r e g f r e e ( ) 函数，以尽早释放占用的存储空间。报告错误信息如果调用函数 r e g c o m p ( ) 或 r e g e x e c ( ) 得到的是一个非 0 的返回值，则表明在对正则表达式的处理过程中出现了某种错误，此时可以通过调用函数 r e g e r r o r ( ) 得到详细的错误信息。 s i z e _ t r e g e r r o r ( i n t e r r c o d e , c o n s t r e g e x _ t * p r e g , c h a r * e r r b u f , s i z e _ t e r r b u f _ s i z e ) ; 参数 e r r c o d e 是来自函数 r e g c o m p ( ) 或 r e g e x e c ( ) 的错误代码，而参数 p r e g 则是由函数 r e g c o m p ( ) 得到的编译结果，其目的是把格式化消息所必须的上下文提供给 r e g e r r o r ( ) 函数。在执行函数 r e g e r r o r ( ) 时，将按照参数 e r r b u f _ s i z e 指明的最大字节数，在 e r r b u f 缓冲区中填入格式化后的错误信息，同时返回错误信息的长度。应用正则表达式最后给出一个具体的实例，介绍如何在 C 语言程序中处理正则表达式。 # i n c l u d e s t d i o . h ; # i n c l u d e s y s / t y p e s . h ; # i n c l u d e r e g e x . h ; / * 取子串的函数 * / s t a t i c c h a r * s u b s t r ( c o n s t c h a r * s t r , u n s i g n e d s t a r t , u n s i g n e d e n d ) { u n s i g n e d n = e n d - s t a r t ; s t a t i c c h a r s t b u f [ 2 5 6 ] ; s t r n c p y ( s t b u f , s t r + s t a r t , n ) ; s t b u f [ n ] = 0 ; r e t u r n s t b u f ; } / * 主程序 * / i n t m a i n ( i n t a r g c , c h a r * * a r g v ) { c h a r * p a t t e r n ; i n t x , z , l n o = 0 , c f l a g s = 0 ; c h a r e b u f [ 1 2 8 ] , l b u f [ 2 5 6 ] ; r e g e x _ t r e g ; r e g m a t c h _ t p m [ 1 0 ] ; c o n s t s i z e _ t n m a t c h = 1 0 ; / * 编译正则表达式 * / p a t t e r n = a r g v [ 1 ] ; z = r e g c o m p ( r e g , p a t t e r n , c f l a g s ) ; i f ( z ! = 0 ) { r e g e r r o r ( z , r e g , e b u f , s i z e o f ( e b u f ) ) ; f p r i n t f ( s t d e r r , " % s : p a t t e r n ' % s ' \ n " , e b u f , p a t t e r n ) ; r e t u r n 1 ; } / * 逐行处理输入的数据 * / w h i l e ( f g e t s ( l b u f , s i z e o f ( l b u f ) , s t d i n ) ) { + + l n o ; i f ( ( z = s t r l e n ( l b u f ) ) ; 0 l b u f [ z - 1 ] = = ' \ n ' ) l b u f [ z - 1 ] = 0 ; / * 对每一行应用正则表达式进行匹配 * / z = r e g e x e c ( r e g , l b u f , n m a t c h , p m , 0 ) ; i f ( z = = R E G _ N O M A T C H ) c o n t i n u e ; e l s e i f ( z ! = 0 ) { r e g e r r o r ( z , r e g , e b u f , s i z e o f ( e b u f ) ) ; f p r i n t f ( s t d e r r , " % s : r e g c o m ( ' % s ' ) \ n " , e b u f , l b u f ) ; r e t u r n 2 ; } / * 输出处理结果 * / f o r ( x = 0 ; x n m a t c h p m [ x ] . r m _ s o ! = - 1 ; + + x ) { i f ( ! x ) p r i n t f ( " % 0 4 d : % s \ n " , l n o , l b u f ) ; p r i n t f ( " $ % d = ' % s ' \ n " , x , s u b s t r ( l b u f , p m [ x ] . r m _ s o , p m [ x ] . r m _ e o ) ) ; } } / * 释放正则表达式 * / r e g f r e e ( r e g ) ; r e t u r n 0 ; } 上述程序负责从命令行获取正则表达式，然后将其运用于从标准输入得到的每行数据，并打印出匹配结果。执行下面的命令可以编译并执行该程序： # g c c r e g e x p . c - o r e g e x p # . / r e g e x p ' r e g e x [ a - z ] * ' r e g e x p . c 0 0 0 3 : # i n c l u d e r e g e x . h ; $ 0 = ' r e g e x ' 0 0 2 7 : r e g e x _ t r e g ; $ 0 = ' r e g e x ' 0 0 5 4 : z = r e g e x e c ( r e g , l b u f , n m a t c h , p m , 0 ) ; $ 0 = ' r e g e x e c ' 小结对那些需要进行复杂数据处理的程序来说，正则表达式无疑是一个非常有用的工具。本文重点在于阐述如何在 C 语言中利用正则表达式来简化字符串处理，以便在数据处理方面能够获得与 P e r l 语言类似的灵活性。

合法的C语言表达式

引用头文件 #include math.h

const double pi=3.41592654;

再写上double tt= sin(pi/6);

sin（30°）在C语言中的表示为 sin(30*3.1415926/180)

关于正则表达式在c语言中的使用问题

单看这个正则的意思是：

匹配以若干个（包括0个）空格或制表符开头，后跟一串不以”/“开头的字符。

显然这和你的要求不符。因为[^/]也可以匹配空白字符。比如：

空格//注释

你的本意是[:blank:]*匹配空格，[^/]不匹配”/“所以该行应该不匹配。

但是，实际的匹配过程没有在此打住：

正则回溯，这一次尝试[:blank:]*神马都不匹配，[^/]匹配空格，.*匹配剩余字符，于是这一行就被匹配了。

稍微改动就可以解决这个问题，^[:blank:]*[^\s/].*$其中\s匹配所有不可见字符，或许你也可以写成^[:blank:]*[^[:blank:]/].*$这种形式，再或者也可以写成只匹配注释的正则，再从不匹配的里面区分代码和空行。

正则表达式查找特定函数类型的函数(C语言)

函数定义double sqrt(x)

double x

{

....

return **

}

函数声明时，只用double sqrt()

函数调用时，一般是x2=sqrt(x)

函数调用时，一般是x2 = sqrt(x)

函数定义double sqrt (x)

函数定义double sqrt( x )

函数定义double sqrt( x2 )

函数定义double sqrt( _x )

函数定义double sqrt( x_ )

函数定义double sqrt( x_y )

函数定义double sqrt( _x, y )

函数定义double sqrt ( xy )

函数定义double sqrt( xy )

你的函数都有形参的么

egrep -in '[[:alpha:]]+[[:space:]]+sqrt[[:space:]]*$[[:space:]]*.*[[:alpha:]]+.*[[:space:]]*$'

考虑了以上几种情形，包括制表符，都符合条件，你看还有什么情形遗漏，可以自行补充一下，共匹配10个结果

如何用正则表达式匹配到C语言中的函数实现部分的函数头部分。

一些补充:脚本是ruby，领会精神就行了……

/regexp/m 多行模式正则表达式

/regexp/ 单行模式正则表达式

=~ 若匹配返回第一个匹配的位置，不匹配则返回nil

$1,$2 反向引用(分别对应第1，2个括号)

string[start...end] 截取字符串从start到end-1的那段dup 复制sub,gsub,sub!,gsub! 字符串替换，感叹号表示替换自身，没感叹号则返回新串正则表达式语法全世界都大同小异，就不解释了……

名称栏目：c语言正则表达式函数,正则表达式 c语言
网站网址：http://cdkjz.cn/article/hsejic.html

返回首页了解更多建站资讯

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

业务热线：400-028-6601 / 大客户专线成都：13518219792 座机：028-86922220

在线咨询提交需求

友情链接交换友情链接

成都免费建网站泽君科技云主机广汉长尔科技网站营销高端网站设计推广 app软件开发公司安卓开发手机网站制作成都网站设计

成都网站建设公司地址：成都市青羊区太升南路288号锦天国际A座10层建设咨询400-028-6601

专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网！ | 成都网站建设哪家好？ | 网站建设地图

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

c语言正则表达式函数,正则表达式 c语言

用C语言完成一个正则表达式的匹配：字符串中只有*和？是可变字符且位置和个数不固定，其他的字符位置固定

C语言怎么用正则表达式

合法的C语言表达式

关于正则表达式在c语言中的使用问题

正则表达式查找特定函数类型的函数(C语言)

如何用正则表达式匹配到C语言中的函数实现部分的函数头部分。

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

业务热线：400-028-6601 / 大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

c语言正则表达式函数,正则表达式 c语言

用C语言完成一个正则表达式的匹配： 字符串中只有*和？是可变字符且位置和个数不固定，其他的字符位置固定

C语言怎么用正则表达式

合法的C语言表达式

关于正则表达式在c语言中的使用问题

正则表达式查找特定函数类型的函数(C语言)

如何用正则表达式匹配到C语言中的函数实现部分的函数头部分。

相关资讯

微信小程序实现列表下拉刷新上拉加载

如何替换php字符串中的字符

在用Springboot搭建项目的时候出现“无法访问此网站“是什么情况

横空出世，rubytestframe

小程序组件之仿微信通讯录的实现代码

Golang中Channel数据结构的作用是什么

mongodb权限管理

JavaScript中parseFloat()函数有什么用

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

业务热线：400-028-6601 / 大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

用C语言完成一个正则表达式的匹配：字符串中只有*和？是可变字符且位置和个数不固定，其他的字符位置固定

业务热线：400-028-6601 / 大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接