Kata pencarian python dalam file teks

Pada artikel ini, kami akan menunjukkan kepada Anda cara mendapatkan nomor baris di mana kata yang diberikan hadir dari file teks menggunakan python

Asumsikan kita telah mengambil file teks dengan nama TextFile. txt yang terdiri dari beberapa teks acak. Kami akan mengembalikan nomor baris di mana kata yang diberikan hadir dari file teks

File Teks. txt

Good Morning TutorialsPoint
This is TutorialsPoint sample File
Consisting of Specific
source codes in Python,Seaborn,Scala
Summary and Explanation
Welcome TutorialsPoint
Learn with a joy

Algoritma (Langkah)

Berikut ini adalah Algoritma/langkah yang harus diikuti untuk melakukan tugas yang diinginkan −

  • Buat variabel untuk menyimpan jalur file teks

  • Buat variabel (yang berisi nomor baris) dan inisialisasi nilainya menjadi 1

  • Masukkan kata sebagai input statis/dinamis dan simpan dalam variabel

  • Gunakan fungsi open()(membuka file dan mengembalikan objek file sebagai hasilnya) untuk membuka file teks dalam mode read-only dengan meneruskan nama file, dan mode sebagai argumen untuk itu (Di sini "r" mewakili read-only

with open(inputFile, 'r') as fileData:
_
  • Lintasi setiap baris file teks menggunakan for loop

  • Gunakan fungsi split() (membagi string menjadi daftar. Kita dapat mendefinisikan pemisah;

  • Menggunakan if conditional statement dan kata kunci “in”, periksa apakah kata yang diberikan ada dalam daftar kata di atas

    Kata kunci in bekerja dengan dua cara −

The in keyword is used to determine whether a value exists in a sequence (list, range, string etc).

    Ini juga digunakan untuk mengulang melalui urutan dalam for loop

  • Cetak nomor baris, jika kata yang diberikan ditemukan di baris yang sesuai

  • Tambah nilai nomor baris dengan 1

  • Tutup file input dengan fungsi close() (digunakan untuk menutup file yang dibuka)

Contoh

Program berikut untuk menghapus baris tertentu dari file teks dan mencetak konten file hasil setelah menghapus baris itu -

# input text file inputFile = "ExampleTextFile.txt" # storing the current line number lineNumber = 1 # Enter the word givenWord = "TutorialsPoint" print('The word {', givenWord, '} is present in the following lines:') # Opening the given file in read-only mode. with open(inputFile, 'r') as fileData: # Traverse in each line of the file for textline in fileData: # Splitting the line into list of words wordsList = textline.split() # Checking if the given word is present in the above words list if givenWord in wordsList: # Print the line number, if the given word is found print(lineNumber) # Increase the value of linenumber by 1 lineNumber += 1 # Closing the input file fileData.close()

Keluaran

Saat dijalankan, program di atas akan menghasilkan keluaran berikut -

The word { TutorialsPoint } is present in the following lines:
1
2
6
_

Kami membaca file teks yang berisi beberapa teks acak dalam program ini. Kami membuat variabel untuk menyimpan nomor baris saat ini dan menginisialisasi ke 1, nomor baris awal. Kami melanjutkan melalui file teks baris demi baris, memecah setiap baris menjadi daftar kata dan memeriksa untuk melihat apakah kata yang diberikan ada dalam daftar. Jika ada, itu mencetak Nomor baris saat ini. Untuk setiap baris, nilai nomor baris bertambah satu

Menemukan kata unik dalam file teks memerlukan pembersihan teks, menemukan kata, dan kemudian menemukan kata unik

Dalam tutorial ini, kita akan belajar cara menemukan kata-kata unik dalam file teks

Langkah-langkah untuk menemukan kata-kata unik

Untuk menemukan kata-kata unik dalam file teks, ikuti langkah-langkah berikut

  1. Baca file teks dalam mode baca
  2. Ubah teks menjadi huruf kecil atau huruf besar. Kami tidak ingin 'apel' berbeda dari 'Apel'
  3. Pisahkan konten file menjadi daftar kata
  4. Bersihkan kata-kata yang penuh dengan tanda baca. Sesuatu seperti menghapus kata-kata dari titik, koma, dll
  5. Juga, hapus apostrof-s
  6. Anda juga dapat menambahkan lebih banyak langkah pembersihan teks di sini
  7. Sekarang temukan kata-kata unik dalam daftar menggunakan Python For Loop dan Operator Keanggotaan Python
  8. Setelah menemukan kata-kata unik, urutkan untuk presentasi

Dalam pembersihan teks, Anda juga dapat menghapus kata kerja bantu, dll

Contoh 1. Temukan kata-kata unik dalam file teks

Sekarang, kami akan menerapkan semua langkah yang disebutkan di atas untuk bekerja menggunakan program Python

Pertimbangkan bahwa kami mengambil file teks berikut

Apple is a very big company. An apple a day keeps doctor away. A big fat cat came across the road beside doctor's office.
The doctor owns apple device.

Program Piton

text_file = open('data.txt', 'r')
text = text_file.read()

#cleaning
text = text.lower()
words = text.split()
words = [word.strip('.,!;()[]') for word in words]
words = [word.replace("'s", '') for word in words]

#finding unique
unique = []
for word in words:
    if word not in unique:
        unique.append(word)

#sort
unique.sort()

#print
print(unique)
_

Keluaran

['a', 'across', 'an', 'apple', 'away', 'beside', 'big', 'came', 'cat', 'company', 'day', 'device', 'doctor', 'fat', 'is', 'keeps', 'office', 'owns', 'road', 'the', 'very']

Terjemahan Langkah-langkah ke dalam Kode Python

Berikut adalah daftar konsep Python yang kami gunakan dalam program di atas untuk menemukan kata-kata unik

  • open() berfungsi untuk mendapatkan referensi ke objek file
  • mengajukan. metode read() untuk membaca isi file
  • str. metode lower() untuk mengonversi teks menjadi huruf kecil
  • str. metode split() untuk membagi teks menjadi kata-kata yang dipisahkan oleh karakter spasi putih seperti spasi tunggal, baris baru, tab, dll
  • str. strip() metode untuk menghapus tanda baca dari tepi kata
  • str. replace() metode untuk mengganti 's dengan apa-apa, di akhir kata
  • for loop untuk mengulangi setiap kata dalam daftar kata
  • in – operator keanggotaan untuk memeriksa apakah kata tersebut ada dalam unique
  • daftar. append() untuk menambahkan kata ke daftar unik
  • daftar. sort() metode untuk mengurutkan kata-kata unik dalam urutan menaik leksikografis
  • fungsi print() untuk mencetak daftar kata unik

Ringkasan

Dalam tutorial Contoh Python ini, kami belajar cara menemukan kata-kata unik dalam file teks, dengan bantuan program contoh

Bagaimana cara mencari kata dalam file teks?

Untuk membuka panel Temukan dari Tampilan Edit, tekan Ctrl+F, atau klik Beranda > Temukan . Temukan teks dengan mengetiknya di kotak Cari dokumen untuk….

Bagaimana Anda memeriksa apakah suatu string ada dalam file teks python?

Buka file
Tetapkan indeks variabel dan tandai ke nol
Jalankan loop melalui file baris demi baris
Dalam loop itu periksa kondisi menggunakan operator 'in' untuk string yang ada sejalan atau tidak. Jika ditemukan bendera ke 0
Setelah loop periksa kembali kondisi apakah flag sudah diset atau belum.
Tutup file

Bagaimana cara mengambil data tertentu dari file teks dengan python?

Cara mengekstrak bagian tertentu dari file teks menggunakan Python .
Pastikan Anda menggunakan Python 3
Membaca data dari file teks
Menggunakan "dengan terbuka"
Membaca file teks baris demi baris
Menyimpan data teks dalam sebuah variabel
Mencari teks untuk substring
Memasukkan ekspresi reguler
Menyatukan semuanya

Bagaimana cara mengekstrak kata tertentu dari file dengan python?

Menggunakan ekspresi reguler untuk mengekstrak kata tertentu . Kita dapat menggunakan metode search() dari modul re untuk menemukan kemunculan pertama dari kata tersebut dan kemudian kita dapat memperoleh kata tersebut menggunakan slicing .