מלחמה וזהו - השוואת תוצאות

זו התוצאה שלי, אשמח לדעת אם יצא לכם כך או אחרת?

לאחר תיקון קוד:

the → 34568
and → 22167
to → 16711
of → 14994
a → 10502
he → 9817
in → 9000
his → 7967
that → 7809
was → 7328

לי יצאו אותן מילים אבל מספרים שונים (ועל כן הסדר מעט שונה)

('the', 34520)
('and', 21724)
('to', 16581)
('of', 14925)
('a', 10473)
('he', 9441)
('in', 8769)
('his', 7940)
('that', 7514)
('was', 7218)

עריכה: אחרי שבצור קל של הקוד:

('the', 34568)
('and', 22167)
('to', 16711)
('of', 14994)
('a', 10502)
('he', 9817)
('in', 9000)
('his', 7967)
('that', 7809)
('was', 7328)

מקודם לא היה מסודר. ערכתי, כך שהסדר של שנינו זהה, רק התוצאות שונות…

לייק 1

הבדלים קטנטנים עבור the , and, a, he, his, that:

the #1 most common word is ‘the’ which appears 34566 in the text
the #2 most common word is ‘and’ which appears 22167 in the text
the #3 most common word is ‘to’ which appears 16711 in the text
the #4 most common word is ‘of’ which appears 14994 in the text
the #5 most common word is ‘a’ which appears 10502 in the text
the #6 most common word is ‘he’ which appears 9817 in the text
the #7 most common word is ‘in’ which appears 9000 in the text
the #8 most common word is ‘his’ which appears 7967 in the text
the #9 most common word is ‘that’ which appears 7809 in the text
the #10 most common word is ‘was’ which appears 7328 in the text

אשמח לאיזה סוג של פידבק בנושא

אחד לאחד אותו דבר :smiley:

לייק 1

היי,
אשמח לעזרה קטנה ממישהו כאן לגבי התוצאות. יצאו לי אותן המילים אבל לא באותה כמות, וממש לא ברור לי למה:
The word ‘the’ appears 31759 times
The word ‘and’ appears 20643 times
The word ‘to’ appears 16340 times
The word ‘of’ appears 14856 times
The word ‘a’ appears 10029 times
The word ‘in’ appears 8233 times
The word ‘he’ appears 7653 times
The word ‘his’ appears 7634 times
The word ‘that’ appears 7281 times
The word ‘was’ appears 7201 time

תודה!!

כנראה שלא ניקית מספיק את הטקסט, למשל that לא שווה ל that. או that, אז צריך לבודד את המילה עצמה ללא תוספות ומשם להתקדם

הצלחתי!
המון תודה על ההכוונה

מתה לדעת אלו סימנים פספסתי, או מה עשיתי לא נכון, שיצאו לי תוצאות רק ‘ליד’.

(‘the’, 34563)
(‘and’, 22151)
(‘to’, 16709)
(‘of’, 14989)
(‘a’, 10494)
(‘he’, 9811)
(‘in’, 8927)
(‘his’, 7965)
(‘that’, 7807)
(‘was’, 7328)

יצאו לך תוצאות “ליד שלי” אבל לי יצא תוצאות “ליד” שלך :slight_smile:
זה לא אומר ששלי נכון אולי אצלי יש טעות

2 לייקים

אתה חמוד… אבל משום מה יש לי תחושה שאתה עלית על משהו שאני לא.
אני כרגע בודקת את זה בדרך הכי פרימיטיבית שיש בקובץ עצמו… :expressionless:

לפי Notepad++ את ממש קרובה

יצא לי בול כמו שלך, דבורה (תודה).
the: 34566
.
.
was: 7328

לייק 1

התרגיל הזה הוציא את הOCD שבי. :confounded:

משהו פה לא הגיוני לי.
יצא לי THE: 34563

ובנוטפאד++ כתוב שיש רק 34566 פעמים.
איך יצא לכם 34568?

כל שאר המילים שמופיעות בקוד של ישראל ואביעד תואמים.

לייק 1

ממש ממש מפריע לי שיצא לי אותו דבר רק ש- “he” יצא לי 9816 ולא 9817 כמוכם :frowning: :face_with_raised_eyebrow:

יצא לי מדויק כמו שלך בכל ה10 מילים! מניחה שניקינו באותו אופן… אם עלית על איזה סימנים פספסת , תכתבי :slight_smile:

לייק 1

הבדל של שתי ספירות

מסגיר משהו מהקוד שלי, נראה לי שבגדר לגיטימי

הדבר היחיד שאני יכולה לחשוב עליו שיוסיף עוד פעמיים לעומת מה שיצא לי (וזה בהתבסס על איך שכתבתי את הקוד שלי) זה the שנדבק אליו מספר מאחד הצדדים. באופן עקרוני אני לא אתקן בשביל זה כי יש מילים לגיטימיות שמכילות גם אותיות וגם מספרים (1st לדוגמא), ואני לא יכולה לחשוב על דרך להפריד בין לגיטימי ולא. (ישראל ואביעד, האם ניקיתם את המילים שלכם מספרות, או שמצאתם פטנט אחר?)

(וגם, רק עכשיו שמתי לב ששכחתי את המילה “times” בהדפסה (את זה כן אחזור לתקן).

אצלי זה נקי גם מספרות
לא נראה לי שמישהו בכלל יתקתנן על ההפרשים של כל אחד מהתשובות בשרשור הזה

לייק 1

לי יש בכלל מספר אחר אבל זה כל כך קיטבג שאני לא מעלה את זה

2 לייקים