GPT (المحولات التوليدية المدربة مسبقًا) هي أحدث نموذج لمعالجة اللغة الطبيعية أصبح شائعًا بشكل متزايد في مهام لغوية مختلفة مثل ترجمة اللغة وتلخيص النص ووكلاء المحادثة. إذا كنت ترغب في استخدام GPT مع أدوات علوم البيانات الشائعة مثل Pandas و Numpy ، فيمكنك الاستفادة من العديد من المكتبات والأطر التي توفر واجهات لنماذج GPT.
كيفية استخدام GPT مع Pandas
- Pandas هي أداة شائعة لتحليل البيانات ومعالجتها وتستخدم على نطاق واسع من قبل علماء ومحللي البيانات. إذا كنت تريد استخدام GPT مع Pandas ، فيمكنك الاستفادة من مكتبة PyTorch-Transformers. توفر المكتبة واجهة بسيطة وبديهية لاستخدام نماذج GPT ، مما يسمح لك بإنشاء نص وإجراء نمذجة اللغة وضبط النماذج في مهام محددة.
- لاستخدام GPT مع Pandas ، يمكنك تثبيت مكتبة PyTorch-Transformers باستخدام النقطة واستيراد الفئات والوظائف الضرورية. على سبيل المثال ، لإنشاء نص باستخدام نموذج GPT مدرب مسبقًا ، يمكنك استخدام الكود التالي:
import pandas as pd
import torch
from transformers import GPT2LMHeadModel, GPT2Tokenizer
tokenizer = GPT2Tokenizer.from_pretrained(‘gpt2’)
model = GPT2LMHeadModel.from_pretrained(‘gpt2’)
text = “Hello, how are you?”
input_ids = tokenizer.encode(text, return_tensors=’pt’)
output = model.generate(input_ids, max_length=50, do_sample=True, num_beams=5, temperature=1.0)
output_text = tokenizer.decode(output[0], skip_special_tokens=True)
df = pd.DataFrame({‘input’: [text], ‘output’: [output_text]})
print(df)
كيفية استخدام GPT مع Numpy
- Numpy هي مكتبة حوسبة رقمية شائعة يستخدمها علماء البيانات ومهندسو التعلم الآلي على نطاق واسع. إذا كنت ترغب في استخدام GPT مع Numpy ، فيمكنك الاستفادة من مكتبة TensorFlow ، التي توفر نموذج GPT مدربًا مسبقًا وتسمح لك بضبط النموذج وفقًا لمهام لغوية محددة.
- لاستخدام GPT مع Numpy ، يمكنك تثبيت مكتبة TensorFlow باستخدام pip واستيراد الفئات والوظائف الضرورية. على سبيل المثال ، لإنشاء نص باستخدام نموذج GPT مدرب مسبقًا ، يمكنك استخدام الكود التالي:
import numpy as np
import tensorflow as tf
import gpt_2_simple as gpt2
sess = gpt2.start_tf_sess()
gpt2.load_gpt2(sess)
text = “Hello, how are you?”
output_text = gpt2.generate(sess, length=50, prefix=text, temperature=0.7, return_as_list=True)[0]
arr = np.array([[text, output_text]])
print(arr)