python - extract each segment from text using regex pattern -
मुझे यह पाठ रेखा है:
01102574 04 n 02 republication 0 republishing 0 003 @ 01101958 एन 0000! 01746163 v 0201 + 01746163 वी 0101! 01758710 v 0541 + 00967643 v 0201 और मुझे पहले 8 अंक और प्रत्येक खंड को इस तरह से प्रश्न चिह्न के रूप में निकालना होगा:
01102574! 01746163 वी 0201! 01758710 v 0541
मैं अजगर में इस regex का उपयोग कर रहा हूँ:
pattern = re.compile (r "" "^ ([0- 9] {8}) (। *?) \! \ (([0-9] {8} \ [az] {1} \ [0-9] {4})) मैच के लिए "" ", पुनः। ओवर बोसे | पुनः। Pattern.finditer (text_in) में: आउटपुट = "% s% s \ n"% (match.group (1, 3)) मेरी समस्या यह है कि मैं केवल सबसे पहले प्राप्त कर सकता हूं प्रश्न चिह्न के बाद खंड और अन्य नहीं मैं सभी खंडों के विरुद्ध regex से कैसे मेल कर सकता हूं।
अग्रिम धन्यवाद।
आप इसका उपयोग कर सकते हैं:
import again text_in = "01102574 04 n 02 republication 0 republishing 0 003 @ 01101958 एन 0000! 01746163 v 0201 + 01746163 v 0101! 01758710 v 0541 + 00967643 v 0201 "; Pattern = re.compile ("((^ [0-9] {8}) | (! [0-9] + [एज़] [0-9] {4}))") पैटर्न में मिलान के लिए। Text_in): प्रिंट मैच [0] आउटपुट:
01102574! 01746163 वी 0201! 01758710 v 0541
Comments
Post a Comment