DEV Community

Durga Pokharel
Durga Pokharel

Posted on • Updated on

Day 78 Of 100DaysOfCode: Worked On Own Project

Today is my 78th day Of #100daysofcode and #python learning journey. Like yesterday today also keep learning from DataCamp for some time.

I spend more time on my project. Being the newbie, I needed more time to write even simple code. I think this is not only my problem. This problem is usually for all newbies. Today I was able to complete some part of my project. Below is my updated code for today.

Python Code

Today I scrape news of province field of Gorkhapatra news portal. After many attempt, I was finally able to write the code.

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import re
from bs4 import BeautifulSoup as BS
import requests
import urllib3
Enter fullscreen mode Exit fullscreen mode

Here is url for a page,

url = "https://gorkhapatraonline.com/province"
Enter fullscreen mode Exit fullscreen mode

Main code is,


 ndict = {'Title': [], "Title URL": [], "Date":[],
    "Author":[], "Author URL":[], "Content":[],"Category": [],"Description": []}
for feature1 in soup.select(".feature1"):
 # feature1 = soup.select_one(".feature1")
 news_url = feature1.a.get("href")
 # news_url
 # title = 
 date=feature1.select_one(".feature-text").small.text.strip()
 title = feature1.select_one(".feature-text").text.strip().split("\n")[0]
 description = None

 category = url.split('/')[-1]

 news_page = http.request('GET', news_url)
 news_soup = BS(news_page.data, "html5lib")
 # print(news_url)
 author_url = news_soup.select_one(".post-author-name").a.get("href")
 if len(news_soup.select_one(".newstext").find("p").find("strong").text.split(" ")) < 6:
  author = news_soup.select_one(".newstext").find("p").find("strong").text
 else:
  author = None
 # print(author)
 # break
 content=""
 for p in news_soup.select_one(".newstext").findAll("p"):
  # print(p.text.split("गते । ")[-1])
  content+=p.text.split("गते । ")[-1]+"\n"

 ndict["Title"].append(title)
 ndict["Title URL"].append(news_url)
 ndict["Author"].append(author)
 ndict["Author URL"].append(content)
 ndict["Content"].append(news_url)
 ndict["Category"].append(category)
 ndict["Date"].append(date)
 print(f"""
    Title: {title}, Title URL: {news_url},
     Date: {date}, Author: {author},
     Category :{category} ,
     Author URL: {author_url}, 
     Content: {content}
      """)
Enter fullscreen mode Exit fullscreen mode

Output of above code is,


    Title: कञचनपुर-कमला राषरिय राजमार चार लेन निरमाण शुरु, Title URL: https://gorkhapatraonline.com/economics/2021-03-17-33886,
     Date: चैत , २०७७ बुधबार, Author: जिवछ यादव ,
     Category :province ,
     Author URL: https://gorkhapatraonline.com/author_news/3, 
     Content: कञचनपुर कमला राषरिय राजमारगको चार लेन निरमाण कार लहान नगरपालिका षेतरमा तीव गतिमा अगाडि बढिररहेको  कुल ८७ किलोमिटर मधये लाहान षेतरमा परने पाँच किलोमिटर सडकको निरमाण वरषा लागनुभनदा अगावै सकने गरी काम अगाडि बढाइएको  सडक निरमाण कार अघि वढेपछि थानीय खुसी छन कञचनपुर कमला परियोजना अनतगर दुई याकेजमा काम सञचालन गरिएको परियोजनाका सुपरीकषक अनिल ढुङगानाले जानकारी दिँदै कुनै बाधा अडचन नभए यही गतिमा काम अगाडि बढिरहे निरधारित तीन वरषभितरमा सपतरीको कञचनपुर सिरहाको कमलासम करिब ८७ किलोमिटर निरमाणकार समपन हुने बताउनुभयो उहाँको अनुसार अहिले सिरहाको दुई ठाँउबाट सपतरीको रुपनीबाट दुई याकेजमा निरमाण कार अघि बढाउने लक अनुसार काम भइरहेको  लहान षेतरमा पाँच किलोमिटर राषरिय मारगमा दुबैतिरबाट माटो पुरने रुख कटान काम अघि बढेको हो बलान नदीमा १२ मिटर चौडाइको पुल निरमाण कारयको थालनी गर तयारी भइरहेको  लहान नगरपालिकामा ओभर फलाईङग पुल तलबाट सडक निरमाणकारयलाई वरषातपछि गरिने सुपरीकषक ढुङगानाले रषटयाउदै बजार षेतरमा रवेश गरेपछि निरमाण कारयलाई झन गति दिएर गरनुपरने जानकारी दिनुभयो राषरिय राजमारगसँग जोडिएका सिरहा सपतरी दुबै जिललाका थानीय तह पालिकाहरुसँग समनवय गरेर कार अघि बढाँउदा थानीय तहहरुबाट निकै सहयोग हुँदा निरमाण कार सहज भइरहेको उहाँले बताउनुभयो राषरिय राजमारगलाई विसतार गर चाइना रेलवे –२ ले निरमाण कारयलाई लहान षेतरमा गति दिएको लाहान नगरपरमुख मुनि साहले भननुहुँदै चार लेनको सडक निरमाण सुरु भैसकेकपछि थानीयमा उतसाह थपिएको     Title: डेढ वरषदेखि यारी नाका भनसार कारयालय बन, Title URL: https://gorkhapatraonline.com/province/2021-03-17-33882,
     Date: चैत , २०७७ बुधबार, Author: राजन रावत ,
     Category :province ,
     Author URL: https://gorkhapatraonline.com/author_news/3, 
     Content: डेढ वरषदखि चीनसँगको सिमाना यारी नाका भनसार कारयालय बन रहँदै आएको  हिलसामा थापना भएको उक भनसार कारयालय २०७६ कातिकपछि बन रहँदै आएको हो 
हिउँदमा बन रहने उक भनसार कारयालय २०७७ सालमा कोरोना कहरको कारण देखाउदै कारयालय करमचारी जिललामा नआएपछि हिलसाको कारयालय बन रहँदै आएको कोष तथा लेखा नियनरण कारयालयका रमुख नविन बिकले बताउनुभयो 
चीनले काेरोनाको कारण नाका बन गरे पनि अन सुरकषा निकाय भने हिलसामा चौकीमा बसदै आएको भए पनि भनसार भने बन रहेको उहाँले बताउनुभयो हाल कोलेनिकामा एक जना कारयालय सहयोगी करमचारी मात भएको अन करमचारीको कुनै पततो नभएको उहाँले बताउनुभयो हिलसामा भनसार कारयालय भाडाको घरमा बसदै आएको  कोरोनाका बीच पनि चीनबाट चार वटा टिपपरमा यापारिक सामान आएको थियो हिलसामै थापना भएको अधयागमन कारयालय पनि डेढ वर दखि बन रहँदै आएको     Title: गाउँमा पसेको हातती धपाउने रममा दुई जना घाइते, Title URL: https://gorkhapatraonline.com/province/2021-03-17-33881,
     Date: चैत , २०७७ बुधबार, Author: झापा, चैत गते ,
     Category :province ,
     Author URL: https://gorkhapatraonline.com/author_news/2, 
     Content: जङगली हाततीको आकरमणमा परी बुदधशानति गाउँपालिका–२ मा आज बिहान दुई जना घाइते भएका छन घाइते हुनेमा इलाम देउमाई नगरपालिका–१० ढोडेनी बसने १९ वरषीय कृतिमान खाती अरजुनधारा नगरपालिका–१ सिसने बसने १९ वरषीय मिलन कारकी डोली रहेको रहरीले जनाएको 
उनीहरूमधये खातीको बिरतामोडसथित बिरतासिटी असपताल डोलीको लिभिङ होम पोलिकलिनिक बुधबारेमा उपचार भइरहेको  रहरीका अनुसार खाती गमभीर घाइते छन उनको हात छातीमा चोट लागेको बोल नसकने अवसथामा छन भने डोली सामान घाइते छन उनीहरू दुवै रमिक हुन आज बिहान ः०० बजे गाउँमा पसेको हातती धपाउने रममा उनीहरू घाइते भएको जिलला रहरी कारयालय झापाका रवकता राकेश थापाले जानकारी दिनुभयो     Title: गैँडा गणनाको तयारी गरिँदै, Title URL: https://gorkhapatraonline.com/province/2021-03-17-33878,
     Date: चैत , २०७७ बुधबार, Author: None,
     Category :province ,
     Author URL: https://gorkhapatraonline.com/author_news/2, 
     Content: यही चैत गतेदेखि शुरु गर लागिएको राषरिय गैँडा गणनाको तयारी तीव पारिएको  चितवन परसा राषरिय निकुञजको गणना एकैसाथ शुरु गरिँदै  परसा राषरिय निकुञजमा परने रतापपुरबाट गणना शुरु गरिनेछ गणनाको समपूर तयारी चितवन राषरिय निकुञजमा नै भइरहेको  चितवन परसालाई एउटा लक बनाइएको  गैँडा रहेका अन दुई राषरिय निकुञजमधये बरदियामा चैत १७ गतेदेखि शुकलाफाँटामा १९ गतेदेखि गणना शुरु गरिँदै  चितवन राषरिय निकुञजका रमुख संरकषण अधिकृत अणनाथ बरालका अनुसार हातती गणकहरु छनोटको काम थालिएको  गणनामा ४० वटा हातती रयोग गरिँदै  दुई निकुञ राषरिय रकृति संरकषण कोषका हातती गणनामा रयोग गरिने  कोशीमा दरबनदी रहेर यहाँ रहेका हातती मधयवरती षेतरमा केही निजी हाततीलाई पनि गणनामा रयोग गरिने 
बरालका अनुसार ४० जना मुख गणक वैकलपिक २० जनालाई गणनामा खटाइँदैछ यसका अतिरिक हाततीको दरबनदीमा रहेका करमचारी खटिनेछन गणनामा खटिनेका लागि यही चैत  गते सौराहामा तालिम दिइँदैछ बरालले भननुभयो, गणनामा यान दिनुपरने विषयमा छलफलसँगै तालिम दिइने ।” गणनाका समयमा आवशयक परने सामगरी खरिद, फारम छपाइको काम यतिबेला भइरहेको उहाँले जानकारी दिनुभयो 
राषरिय रकृति संरकषण कोष सौराहाका रमुख डा बाबुराम लामिछानेका अनुसार गणनामा खटिने करमचारी, हातती छनोटसँगै उनीहरुको बाससथानको यवसथापनलगायतका तयारी भइरहेको  निकुञजको गणना गरनुपरने षेतरको अधययन भइरहेको उहाँले जानकारी दिनुभयो लामिछानेले भननुभयो, हामी अनतिम तयारीमा छौँ ।” यहाँका दुई निकुञजमा गैँडा गणना गर २० दिन हाराहारी लागने उहाँले बताउनुभयो 
गैँडा गणना राषरिय निकुञ तथा वनयजनतु संरकषण विभागको नेतृतवमा हुँदैछ विभागका दुई करमचारी तयारीका लागि यहाँ आइसकेका छन विभागका सूचना अधिकारी इकोलोजिष हरिभद आचारयका अनुसार गणनाको उदघाटन वन तथा वातावरणमनरी रेम आलेले गरने कारयकरम  सौराहामा कारयकरमको उदघाटन गरेर रतापपुरबाट गणना थालने वा रतापपुरमा नै उदघाटन गरने भनने विषयको टुङगो भने लागिनसकेको उहाँले बताउनुभयो एक÷दुई दिनमा नै विभागको उचचसतरको टोलीसमेत गणना तयारीका लागि चितवन आउँदैछ आचारयका अनुसार चैत २९ गतेसमममा चारवटै निकुञजमा गैँडा गणना सकेर वैशाख पहिलो साता नतिजा सारवजनिक गरने गरी तयारी गरिएको  गत वर चैत ११ गतेदेखि गैँडा गणना गरने भनिए पनि कोरोना सङरमणका कारण अनतिम तयारी भएपछि थगन भएको थियो दुई वरषअघि गैँडा गणना गर लागिएको भए पनि ततकालीन समयमा दाताको भर परदा बजेट अभावमा गणना हुनसकेको थिएन 
सरकारले गत वर गैँडा गणनाका लागि रु एक करोड १० लाख विनियोजन गरेको थियो आचारयका अनुसार गत वर केही सामगरी खरिद भएकाले यस वर सरकारले रु ८० लाख विनियोजन गरेको  दाताबाट रु २५ लाख हाराहारी सहयोग हुने उहाँले जानकारी दिनुभयो राषरिय रकृति संरकषण कोष (एनटिएनसी), विश वनयजनतु कोष (डबलुडबलुएफ) नेपाल जेडएसएल नेपाललगायतका सङघसंसथाको सहयोगमा गैँडा गणना गरिँदैछ 
हरेक पाँच वरषमा गैँडा गणना गरने गरिन यसअघि सन २०१५ मा गैँडा गणना गरिएको थियो निकुञजलाई विभिन लक बनाएर राविधिकले एकएक गरी गैँडा गननेछन गणनाका लागि हातती, दूरबिन, यामेरालगायत रयोग गरिन गैँडाको सङया, रजनन अवसथा, विचरण आहाराको अवसथा थाहा पाउन हरेक पाँचपाँच वरषमा गैँडा गणना गरिँदै आएको थियो गणनापछि यसको अवसथा हेरेर यवसथापनको काम गरिनेछ 
निकुञजका सूचना अधिकारी लोकेन अधिकारीका अनुसार पछिललोपटक सन २०१५ को गणनामा नेपालमा कुल ६४५ गैँडा थिए तथयाङकअनुसार चितवनमा ६०५, बरदियामा २९, शुकलाफाँटामा आठ परसामा तीन गैँडा भेटिएका थिए नेपालमा सन १९५० मा ८००, १९५५ मा ४००, १९६० मा ३००, १९६५ मा १००, १९७० मा १०८, १९७५ मा १४७, १९८० मा ३१०, १९८५ मा ३१०, १९९० मा ३५८, १९९५ मा ४६६ रहेको विभागको तथयाङकमा उललेख  यसैगरी सन २००० मा ६१२, २००५ मा ४०९, २०१० मा ४३५ हुँदै पछिललो गणना सन २०१५ मा ६४५ पुगेको अधिकारीले बताउनुभयो 


Enter fullscreen mode Exit fullscreen mode

Day 78 Of #100daysofcode and #Python
Worked On Own Project(News Scrapping)#womenintech #100DaysOfPython #CodeNewbie #DEVCommunity pic.twitter.com/pwsM3dOK99

— Durga Pokharel (@mathdurga) March 17, 2021

Top comments (0)